学习所用,可随意转载,转载请注明出处,或在本文下方留言说明即可,谢谢!
对于一个中文文本分词,运行出错,结果如下:
'utf-8' codec can't decode byte 0xb2 in position 0: invalid start byte
万恶的编码问题,初步可以看出事编码问题,突然想到txt文件自带编码,赶紧打开发现
果然是默认的编码是“ANSI”,改为“utf-8”即可。
学习所用,可随意转载,转载请注明出处,或在本文下方留言说明即可,谢谢!
对于一个中文文本分词,运行出错,结果如下:
'utf-8' codec can't decode byte 0xb2 in position 0: invalid start byte
万恶的编码问题,初步可以看出事编码问题,突然想到txt文件自带编码,赶紧打开发现
果然是默认的编码是“ANSI”,改为“utf-8”即可。
Copyright © 2019- how234.cn 版权所有 赣ICP备2023008801号-2
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务