橘子园

种橘子的地方

0%

电子书爬虫app

一个爬取市面上主流电子书购买渠道上电子书价格的app
名字还没想好…起名困难症
逻辑如下:

  1. 搜索一个默认会返回无结果的词,现在是”__“,记录主要DOM结构(以下简称结构,此结果简称空白结果).
  2. 搜索需要的书名
    • 如果结构与空白结果相同,则无此电子书出售,结束.
    • 反之,进入第三步.
  3. 检索页面中含”¥”的第一个DOM标签,同时,当结果为多个时,应给出警告;提取距离该DOM标签最为接近的数字,进入比对集进行比对.
  4. 打开比对集中最小值对应的app或网页

代码在这里