一种绕过约束下载论文的思路

一种绕过约束下载论文的思路注:本文下面的内容仅评论绕过思路,作为技能交流之用。咱们下载论文仍是应该经过正规渠道,付费下载,尊重各位站长的劳动成果。灵敏图片和代码中触及站点的内容均已打码。
有时候要研讨技能,...注:本文

注:本文下面的内容仅评论绕过思路,作为技能交流之用。咱们下载论文仍是应该经过正规渠道,付费下载,尊重各位站长的劳动成果。灵敏图片和代码中触及站点的内容均已打码。
有时候要研讨技能,...

注:本文下面的内容仅评论绕过思路,作为技能交流之用。咱们下载论文仍是应该经过正规渠道,付费下载,尊重各位站长的劳动成果。灵敏图片和代码中触及站点的内容均已打码。
有时候要研讨技能,咱们也需求下载一些论文来看看的。一些论文站点,尽管供给预览功用,可是下载却是收费的。
举个比如,如下站点:

当咱们点击“赞同并开端全文预览”按钮时,是有一个弹出窗口来预览论文的。

可是当咱们点击“下载”按钮时,却提示需求收费。

一方面它单篇论文的收费真实是挺贵的;别的一方面,咱们或许更倾向于把论文批量下载到本地,比及有时间时渐渐读完。这该怎么办呢?
咱们F12看看预览页面的内容:

能够明晰的看到,id=”pdf”的div下的每个子节点div对应着论文的每一页,而每一个子div中包括的img标签对应的图片则是每一页的内容。咱们将img标签的src中的链接仿制出来,粘贴在浏览器的新页签中,其实是能够看到本页论文内容,而右键“保存图片”是能够将此页论文保存到本地的。

以上便是手动绕过约束下载论文的思路。可是有的论文页数真实太多,手动逐一仿制链接下载真实有些功率低下,所以咱们能够写个脚原本提高功率。
#coding:utf-8
import traceback
import urllib2
import urllib
import sys
import Queue
import os
import time
from bs4 import BeautifulSoup
from selenium import webdriver
driver = webdriver.Firefox()
driver.implicitly_wait(30)
host = "此处打码"
searchurl = "https://" + host + "/index.php?m=Search&a=index"
dstpath = "h:/downloadpdf"
download_queue = Queue.Queue()
reload(sys)
sys.setdefaultencoding("utf-8")
class UnicodeStreamFilter: 
  def __init__(self, target): 
      self.target = target 
      self.encoding = 'utf-8' 
      self.errors = 'replace' 
      self.encode_to = self.target.encoding 
  def write(self, s): 
      if type(s) == str: 
          s = s.decode("utf-8") 
      s = s.encode(self.encode_to, self.errors).decode(self.encode_to) 
      self.target.write(s) 
       
if sys.stdout.encoding == 'cp936': 
  sys.stdout = UnicodeStreamFilter(sys.stdout)
def get_search_result(keywords):
  data = {"q":keywords}
  headers = {"cookie":"拜访论文站点时f12看到的cookie填入此处,此处打码"}
  req = urllib2.Request(url=searchurl,data=urllib.urlencode(data),headers=headers)
  res = urllib2.urlopen(req)
  content = res.read()
  soup = BeautifulSoup(content, features="lxml")
  divlist = soup.find_all(class_="item-title")
  if divlist is not None and len(divlist) > 0:
      for divitem in divlist:
          alist = divitem.find_all("a")
          if alist is not None and len(alist) > 0:
              ahref = alist[0].attrs["href"]
              title = alist[0].attrs["title"]
              download_queue.put([
                  "http://%s%s"%(host,ahref,),
                  title
              ])
def save_pdf(title, imgls, chost):
  headers = {
      "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8",

[1] [2] [3]  黑客接单网

内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/7435.html

(0)

相关推荐

  • 闺阁的意思,闺阁是什么意思-组词(字义,诗词)

    词组闺阁的意思,闺阁是什么意思-组词(字义,诗词)基本解释详细字义 闺阁拼音:guī gé注音:ㄍㄨㄟ ㄍㄜˊ解释:闺房。精选例句1、闺阁还是上海弄堂的幻觉,便灰飞烟散,却也是一幕接一幕,2、老人欢畅大笑,高声问

    阅读 2021年11月30日
  • 冰箱搬运时能平放吗

    冰箱搬运时能平放吗 冰箱在运输过程中不能平放,因为平放运输时,压缩机会产生较大的震动,导致与之相连的吸气和排气管道严重变形甚至断裂,从而损坏冰箱,影响其正常使用。冰箱可以倾斜运输,但不能水平运输。运输后,将冰箱稳定放置4

    电商 2021年10月7日
  • 怎么用OBS和WebSockets播放视频流

    技术怎么用OBS和WebSockets播放视频流这篇文章主要为大家展示了“怎么用OBS和WebSockets播放视频流”,内容简而易懂,条理清晰,希望能够帮助大家解决疑惑,下面让小编带领大家一起研究并学习一下“怎么用OB

    攻略 2021年10月26日
  • 啥是引流啊,引流方式是什么

    转载自微信公众号“呵员外”(ID:Yuanwai-HE),作者呵先生。我们做引流的目的:让隐性消费者

    2022年5月30日
  • 香蕉治便秘,便秘吃香蕉好吗

    一说到通便的水果,大多数人首先想到的就是香蕉了吧。其实,香蕉的通便效果并没有很突出。

    生活 2021年11月21日
  • 《非匿名指令》氪石如何分析氪石的最新玩法

    《非匿名指令》 氪金怎么玩氪金最新玩法分析,《非匿名指令》是近未来城市的强力牌RPG手游,很多玩家不太清楚游戏中如何使用氪金,选择什么样的礼包比较好。 编辑整理了相关资料,希望能有...

    2022年10月23日