|
本帖最后由 viiber 于 2022-3-17 17:20 编辑
学爬虫的时候搓了一个京东自动评价的脚本,是基于两位大佬的脚本修改的。但是在调试的时候苦于ck不够用,发现存在挺多不完善的地方。
在这里分享出来给各位mjj,顺便也请大佬们看看脚本的问题:
1、在一些反馈结果里result存在很多重复,虽然可以用set方法去除,但是我仍然不知道为什么会产生语句重复。说实话zhon库还是没搞明白
2、爬取的句子在筛选的时候好像套了几层列表,最后就把自己搞得晕乎乎的了。结果是result里面会出现单独的标点符号。这应该是zhon的分词返回的是列表,目前也还没搞明白
这里是脚本地址 https://github.com/Dimlitter/jd_AutoComment
当然,欢迎大佬们来提PR,但是如果你向我问诸如没安装上库的报错...那我也没义务包办到底
声明
本项目为Python学习交流的开源非营利项目,仅作为程序员之间相互学习交流之用。
严禁用于商业用途,禁止使用本项目进行任何盈利活动。
使用者请遵从相关政策。对一切非法使用所产生的后果,我们概不负责。
本项目对您如有困扰请联系我们删除。 |
|