电子书爬虫app 发表于 2016-10-07 更新于 2020-05-19 一个爬取市面上主流电子书购买渠道上电子书价格的app名字还没想好…起名困难症逻辑如下: 搜索一个默认会返回无结果的词,现在是”__“,记录主要DOM结构(以下简称结构,此结果简称空白结果). 搜索需要的书名 如果结构与空白结果相同,则无此电子书出售,结束. 反之,进入第三步. 检索页面中含”¥”的第一个DOM标签,同时,当结果为多个时,应给出警告;提取距离该DOM标签最为接近的数字,进入比对集进行比对. 打开比对集中最小值对应的app或网页 代码在这里