MJJ论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

查看: 3230|回复: 14

正文提取算法

[复制链接]
发表于 2011-1-3 17:32:07 | 显示全部楼层 |阅读模式
基本是给垃圾站加上了核动力


比如下面这个,没有针对163写任何规则,自动提取网页正文,



[ 本帖最后由 God 于 2011-1-3 17:35 编辑 ]
发表于 2011-1-3 17:32:41 | 显示全部楼层
什么东东?看似很牛X啊 、
发表于 2011-1-3 17:33:28 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2011-1-3 17:33:28 | 显示全部楼层
什么?
发表于 2011-1-3 17:34:45 | 显示全部楼层
没看懂啊?什么意思嘛
发表于 2011-1-3 17:48:45 | 显示全部楼层
原理很简单的,呵呵,没啥特别的
发表于 2011-1-3 17:53:11 | 显示全部楼层
正则。。。
发表于 2011-1-3 18:32:01 | 显示全部楼层
不用正则,我这里有几份算法
发表于 2011-1-3 18:36:53 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2011-1-3 18:42:40 | 显示全部楼层
没看懂
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|MJJ论坛

Copyright MJJ论坛 © 2022 All Rights Reserved.

快速回复 返回顶部 返回列表