query_arXiv.py mkmd.py arvixのpaperを検索してダウンロードするシステム
ディレクトリは相対パスで書く python mkmd.py -o outputtest.md -d ./
query_pdf.py mkmd_pdf.pyは指定したpaperを要約する
python query_pdf.py --pdf_file [path to your directory/title_of_the_paper.pdf] (--dir ./xmls)
python mkmd_pdf.py --dir ./xmls (--output ./output)
デフォルトで、 (--dir ./xmls),(--output ./output)になっています。
arXiv の論文を検索してPDFと書誌データ、chatGPTによる要約情報をxmlファイルとして保存するquery_arxiv.py と、保存したxmlファイル(群)から 図を抜き出して marp 形式ファイル として保存する mkmd.py から成る。
query_arxiv.py で OpenAI のAPIキーを設定する。
openai.api_key = 'sk-....'arXivから論文を検索、xml形式で保存し、要約を作成
$ python query_arxiv.py [-d directory] [-n num-papers] [-y from-year] "search keywords" ダウンロードした情報からスライド(markdown)を作成
$ python mkmd.py [-o output.md] [-d directory] "keyword"
directory はxmlファイルが保存されるディレクトリ
生成された ***.md ファイルは marp (https://marketplace.visualstudio.com/items?itemName=marp-team.marp-vscode ) に準拠しているので、 VS Codeで読み込めばスライド形式として閲覧したり、PDFファイルとして保存することができます:
