易语言网络小说采集器
1. 易语言获取小说网页内的小说。。。
用采集吧
简单,好写
网上有很多这方面的教程
搜一下 易语言采集教程
超简单
2. 用易语言采集网页数据问题,高分
先用HTTP读源码,然后用文本分割命令,切割出对你有用的那段数字代码,然后存入超级列表框就行了
3. 我想用易语言做一个软件,就是通过ID,采集一个用户在同一个帖子下的说有发言。现在问题来了
也可以取网页接口,直接弄其中的ID,当然易语言取网页接口麻烦,用c++发现更麻烦,如果用C#就特快,如果不会C#就用正则表达式吧。
4. 站群自动采集软件 用什么写的 易语言可以写吗
市面站群软件大部分用 .net写的,需要安装.net环境,小猪seo软件用 vc写的,更轻巧易用。
实际站群软件核心是需要数据库支撑,数据库记录关键词、关键词网址、发布文章网址,文章、网站串联使用,小猪SEO软件 还支持自动分词,并根据文章相关性来加锚,这种实际上已经属于 搜索引擎技术了。
说了这么多,实际上你如果懂数据库,懂网络协议(主要是HTML传输),是有可能用易语言写出站群软件。
5. 用易语言正则写小说下载器怎么写
大致就是这样的顺序。读网页文本----经过若干个正则匹配后读出。
你可以去易语言官方论坛搜索下,正则匹配的例程很多,也不是很难。
6. 易语言采集网页要懂源代码吗不懂完全怎么办
使用HTTP读文件(“网页链接”)即可获取该网页的源代码
注:一般网页使用的是UTF-8编码,获取后是UTF-8编码
获取后如需正常读(如中文的问号,文字类)需要使用
编码转换()
将UTF-8编码转换为GB2312(忘了,大概是这个名字)
就可以了
或者可以使用别人已经编译好的模块
有些功能性网站可以不用,或者你只是截取一段数据之类
具体看你的需求
7. 求易语言采集写入网页
发详情链接看看是什么样的
8. 关于易语言要采集的网页源码几万超过了最大限制问题
如果源码取出正常的话, 你可以取文本长度 然后等分长度分割 保存
9. 易语言正则批量采集,目前就实现采集一页。
思路应该是,读完第一页内容后,用正则去取匹配文本,再计次循环()处理获得匹配文本,再读第二页的网页内容,于此循环。使用大致代码如下
正则.创建 (“正则表达式”, )
.计次循环首 (27, a1)
HTTP读文件 (“固定的网页地址” + a1 + “可能有的网页后缀”) ' a1为网页页码
.计次循环首 (24, a2)
超级列表框1.置标题 (a2, 1, 正则.取匹配文本(a2,2)) ’处理正则表达式的内容
.计次循环尾 ()
.计次循环尾 ()
10. 找了一个易语言源码,是提取百度贴吧LZ写的小说的。
这些都是html代码,你试试把文本文件后缀改成.html,然后用浏览器打开,这样浏览器就会识别那些代码,然后他的显示形式只是文本样式,然后再看看能否直接在打开的网页中复制出完整的内容来,试试吧。
