Skip to content

dreaveler/screenshotTomd

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 
 
 

Repository files navigation

必读说明

这是一个我在上CV导论课时被不停的复制公式发给GPT/DS然后再等输出粘过去搞得不厌其烦的构想,它只需要能够读取剪贴板再发给一个多模态大模型再把大模型转化好的markdown格式传到剪贴板里粘过去就可以了。这其中有很多比我想得实现起来更加困难的地方,我也做了相应的妥协,后续有时间会不断优化改进,以及做出来一个GUI的。
!你的截图软件必须把图片截到剪贴板里!!!!!

开始

必须有python,版本最好>=3.8 我的开发是用的3.13
必须的库有 openai pillow pywin32 pywinauto keyboard
其余调用的库是内置库
在文件夹中键入

pip install openai pillow pywin32 pywinauto keyboard
python getPhoto.py

即可开始文件 你只需要负责截图软件是截到剪贴板里之后就不需要操作了,每次当你向剪贴板中放入新图片后,程序会自动运行。

调用API

在api.py文件中,你可以设定api_key以及url,因为这个任务对于LLM来说并不困难,我这里图省事就调的kimi的api,本来以为不用花钱的,但还是需要花一些钱,好在kimi会送15的额度,可以暂时先用着。
文件中的提示词与输入我设定好了,想的话也可以自己改。
我在考虑本地模型的效果,回头可能会试一试电脑上的7b的ds效果以及反应速度如何,如果不是太慢的话我也会把它加到功能里。

复制进笔记软件

我的笔记软件是obsidian,所以在input.py中就找到了obsidian对应的窗口,然后再飞快的打开并粘贴,然后再把它最小化,可能给人的体验不太好,后续会进一步优化,毕竟我也希望它在后台就可以完成这一进程。
!!重要:首先笔记软件必须打开状态在后台,且打开后必须有键入的光标才可以粘贴过去。
呃其实没有光标的状态我没有试,但好像有一次是这样的,然后没有反应。

后续改进方向:
本地模型的可能性
完全在后台完成进程
粘贴过程中虽然只有一瞬,但禁止键盘输入。
GUI
暂停以及退出

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages