采纳答案成功!
向帮助你的同学说点啥吧!感谢那些助人为乐的人
老师你好,课程中讲到的是一个字符串产生的编码问题,如果是一个csv文件中出现多种编码格式怎么处理,例如我用utf-8读取这个csv文件,但是文件中个别数据不是utf-8的编码类型(猜测数据下载时出现问题),导致无法正常完成读取文件的操作,有没有方式可以解决这个问题?
能发一下具体的文件不,需要结合者具体的问题看,一般编码都是在文件上的,不会一个文件中有多种编码
应该是数据源的问题,数据存储的不规范,在使用padnas库读取csv文件的时候,如果使用默认的utf8编码,会报在多少行读取的时候,utf8编码不能正常读取,换成常见的GBK或者GB18030也会报编码的问题,如果数据当中出现错位的情况,应该怎么处理这种文件呢?
编码的问题只有一个个的尝试,没有其他更好的办法
登录后可查看更多问答,登录/注册
带你彻底掌握Scrapy,用Django+Elasticsearch搭建搜索引擎
4.8k 30
2.5k 18
1.1k 18
1.4k 15
2.8k 15