Conversation
问题:python第三方包playwright及相关依赖安装不到青龙容器中,其他容器我没试过
|
我一般用的比较多的爬虫是playwright,这个github action中可以安装使用。但是青龙中装不了。 我目前想到的办法是,用playwright每天固定时间在github用爬虫获取cookie,然后用青龙拉取,但是这太笨了。如果能把playwright相关的包放进青龙,就可以在需要的时候自己运行了。 playwright相关安装: |
|
嗯你是对的,其实验证已经过了,但是因为账号和密码错了,最后 这一块验证可以优化下。 然后读取用户名和密码,可以从env环境变量里读 解析出cookie后,如果是青龙就存青龙环境变量里,如果是其他平台,就存bili根目录下的cookies.json里 这样,这个功能就完整了。 抽空我来看下怎么改。 |
|
我其实更想知道怎么把playwright这个包弄上,或者另外找个第三方包。我是真的搞不定。 这个循环判断,我懒得翻网页内容的变化(主要是对网页这一块真心不了解),所以就抓了title这个特征。这肯定是不合适的。 我用playwright纯粹就是为了模拟网页操作,效率低很多,但是一般来说,这种基于网页操作,网站也不会去管。 我主要是给大佬分享一个我之前弄得一些策略,要是有用更好,没用也就算了。 |
|
直接pip写到extra.sh里装不进青龙里吗 |
|
我试过,装不了。报错是找不到对应版本。 |
|
搜嘎!我的也是3.11版本的python。 |
|
个人觉得ocr没有必要,ocr若合并到主版本,会使项目体积增加很多。 |
绕不开ocr这个过程,除非你有极验的内部api,不然获取极验那个token也需要ocr |
你可能没理解我意思😂,我的意思是让用户手动验证,不是用ocr |
可以看看我超链接的手动验证器,用起来还不错。 |
哦…我主要是想让整个过程完全自动化,不用人为干预… 我看过那个api,我觉得既然也需要人工点击,就不如直接通过官方页面点击验证了,然后我就把别的地方写的这个验证拉过来了 |
|
直接用还不如你写的那个扫码登陆呢😂发自我的手机
|
如果能把这个识别过程整合到青龙,就不用再摸手机了…但是我觉得再额外调用第三方接口,如果人家接口变化,维护起来也怪麻烦的…不如直接ocr… |
|
或者说可以你自己写一个网页,接受key,再callback回token,青龙每天可以推送通知链接,你再手动验证下?-------- 原始邮件 --------发件人: AFUL ***@***.***>日期: 2022年12月21日周三 10:16收件人: RayWangQvQ/BiliBiliToolPro ***@***.***>抄送: Gumingjie0312 ***@***.***>, Comment ***@***.***>主 题: Re: [RayWangQvQ/BiliBiliToolPro] [有问题] 使用用户名+密码登录 (PR #356)
直接用还不如你写的那个扫码登陆呢😂发自我的手机
如果能把这个识别过程整合到青龙,就不用再摸手机了…但是我觉得再额外调用第三方接口,如果人家接口变化,维护起来也怪麻烦的…不如直接ocr…
扫码这个我纯粹是看别人说可以用这种方式登录弄爬虫,就顺手试了试,我还是觉得所有语言人工干预的登录过程都太麻烦了…所以就把这个ocr的拿了过来…
—Reply to this email directly, view it on GitHub, or unsubscribe.You are receiving this because you commented.Message ID: ***@***.***>
|
我不会写网站…青龙那个通知我也不会用…😂😂😂 |
|
那就让项目主来搞吧
|
你说的那个接口,我其实也看到过。 我本地试过,这个ocr登录获取cookie的成功率挺高的,比我想象的高,虽然都是别的不好。 其实,真正比较大的包不是ocr那个包,是playwright这个包,也可以用Selenium+对应的webdriver实现,但是这一套的包也比较大。不过用这套爬虫方法,除非比较异常的登陆模式(规律性太强,或者每天登录次数过多等),后台检测不出来,这就是驱动浏览器去登录,所以也比requests那个库慢很多。 |







问题:python第三方包playwright及相关依赖安装不到青龙容器中,其他容器我没试过
【内容】:
昨天看到大佬对我工作的认可,我就再抛砖引玉一下。
分享一下通过用户名+密码登录的爬虫。我现在本地用这个直接获取cookie并打开存储cookie的文件复制。
具体的问题,以及相关包安装,我都写进源码了。
Login_Bili.py不过这个方式有比较严重的问题,playwright这个包以及相关依赖我装不进青龙容器,其他容器我没试过。
这个方法分享给大佬,主要是想给大佬分享一个登录方式,希望大佬能把这套方法改一下,以后直接账号密码弄。