xlang-ai
diff --git a/‎data/research/papers.json‎
Lines changed: 61 additions & 97 deletions b/‎data/research/papers.json‎
Lines changed: 61 additions & 97 deletions
diff --git a/‎data/team/alumni.csv‎
Lines changed: 18 additions & 18 deletions b/‎data/team/alumni.csv‎
Lines changed: 18 additions & 18 deletions
diff --git a/‎data/team/graduates.csv‎
Lines changed: 1 addition & 0 deletions b/‎data/team/graduates.csv‎
Lines changed: 1 addition & 0 deletions
diff --git a/‎public/research/batch.png‎
108 KB b/‎public/research/batch.png‎
108 KB
diff --git a/‎public/research/does.png‎
137 KB b/‎public/research/does.png‎
137 KB
@@ -25,27 +25,15 @@
   },
   {
     "category": ["CodeGeneration"],
-    "title": "BRIGHT: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval",
-    "authors": "Hongjin Su, Howard Yen, Mengzhou Xia, Weijia Shi, Niklas Muennighoff, Han-yu Wang, Haisu Liu, Quan Shi, Zachary S. Siegel, Michael Tang, Ruoxi Sun, Jinsung Yoon, Sercan O. Arik, Danqi Chen, Tao Yu",
+    "title": "Spider 2.0: Evaluating Language Models on Real-World Enterprise Text-to-SQL Workflows",
+    "authors": "Fangyu Lei, Jixuan Chen, Yuxiao Ye, Ruisheng Cao, Dongchan Shin, Hongjin Su, Zhaoqing Suo, Hongcheng Gao, Wenjing Hu, Pengcheng Yin, Victor Zhong, Caiming Xiong, Ruoxi Sun, Qian Liu, Sida Wang, Tao Yu",
     "publication": "Preprint",
-    "paperLink": "https://arxiv.org/abs/2407.12883",
-    "codeLink": "https://github.com/xlang-ai/BRIGHT",
+    "paperLink": "https://www.arxiv.org/abs/2411.07763",
+    "codeLink": "https://github.com/xlang-ai/Spider2",
     "dataLink": "",
     "blogLink": "",
     "twitterLink": "",
-    "image": "/research/bright.jpg"
-  },
-  {
-    "category": ["CodeGeneration"],
-    "title": "Spider2-V: How Far Are Multimodal Agents From Automating Data Science and Engineering Workflows?",
-    "authors": "Ruisheng Cao, Fangyu Lei, Haoyuan Wu, Jixuan Chen, Yeqiao Fu, Hongcheng Gao, Xinzhuang Xiong, Hanchong Zhang, Yuchen Mao, Wenjing Hu, Tianbao Xie, Hongshen Xu, Danyang Zhang, Sida Wang, Ruoxi Sun, Pengcheng Yin, Caiming Xiong, Ansong Ni, Qian Liu, Victor Zhong, Lu Chen, Kai Yu, Tao Yu",
-    "publication": "NeurIPS 2024, Spotlight",
-    "paperLink": "https://arxiv.org/abs/2407.10956",
-    "codeLink": "https://github.com/xlang-ai/Spider2-V",
-    "dataLink": "",
-    "blogLink": "https://spider2-v.github.io/",
-    "twitterLink": "",
-    "image": "/research/spider2v.jpg"
+    "image": "/research/spider2.jpg"
   },
   {
     "category": ["DigitalAIAgents"],
@@ -61,15 +49,27 @@
   },
   {
     "category": ["CodeGeneration"],
-    "title": "Spider 2.0: Evaluating Language Models on Real-World Enterprise Text-to-SQL Workflows",
-    "authors": "Fangyu Lei, Jixuan Chen, Yuxiao Ye, Ruisheng Cao, Dongchan Shin, Hongjin Su, Zhaoqing Suo, Hongcheng Gao, Wenjing Hu, Pengcheng Yin, Victor Zhong, Caiming Xiong, Ruoxi Sun, Qian Liu, Sida Wang, Tao Yu",
+    "title": "BRIGHT: A Realistic and Challenging Benchmark for Reasoning-Intensive Retrieval",
+    "authors": "Hongjin Su, Howard Yen, Mengzhou Xia, Weijia Shi, Niklas Muennighoff, Han-yu Wang, Haisu Liu, Quan Shi, Zachary S. Siegel, Michael Tang, Ruoxi Sun, Jinsung Yoon, Sercan O. Arik, Danqi Chen, Tao Yu",
     "publication": "Preprint",
-    "paperLink": "https://www.arxiv.org/abs/2411.07763",
-    "codeLink": "https://github.com/xlang-ai/Spider2",
+    "paperLink": "https://arxiv.org/abs/2407.12883",
+    "codeLink": "https://github.com/xlang-ai/BRIGHT",
     "dataLink": "",
     "blogLink": "",
     "twitterLink": "",
-    "image": "/research/spider2.jpg"
+    "image": "/research/bright.jpg"
+  },
+  {
+    "category": ["CodeGeneration"],
+    "title": "Generative Representational Instruction Tuning",
+    "authors": "Niklas Muennighoff, Hongjin Su, Liang Wang, Nan Yang, Furu Wei, Tao Yu, Amanpreet Singh, Douwe Kiela",
+    "publication": "ICLR 2024 AGI Workshop, Best Paper Award",
+    "paperLink": "https://arxiv.org/abs/2402.09906",
+    "codeLink": "https://github.com/ContextualAI/gritlm",
+    "dataLink": "",
+    "blogLink": "",
+    "twitterLink": "https://twitter.com/Muennighoff/status/1758307967802224770",
+    "image": "/research/grit.jpeg"
   },
   {
     "category": ["DigitalAIAgents"],
@@ -83,30 +83,30 @@
     "twitterLink": "https://twitter.com/TianbaoX/status/1778781521253667267",
     "image": "/research/osworld.png"
   },
+  {
+    "category": ["CodeGeneration"],
+    "title": "Spider2-V: How Far Are Multimodal Agents From Automating Data Science and Engineering Workflows?",
+    "authors": "Ruisheng Cao, Fangyu Lei, Haoyuan Wu, Jixuan Chen, Yeqiao Fu, Hongcheng Gao, Xinzhuang Xiong, Hanchong Zhang, Yuchen Mao, Wenjing Hu, Tianbao Xie, Hongshen Xu, Danyang Zhang, Sida Wang, Ruoxi Sun, Pengcheng Yin, Caiming Xiong, Ansong Ni, Qian Liu, Victor Zhong, Lu Chen, Kai Yu, Tao Yu",
+    "publication": "NeurIPS 2024, Spotlight",
+    "paperLink": "https://arxiv.org/abs/2407.10956",
+    "codeLink": "https://github.com/xlang-ai/Spider2-V",
+    "dataLink": "",
+    "blogLink": "https://spider2-v.github.io/",
+    "twitterLink": "",
+    "image": "/research/spider2v.jpg"
+  },
   {
     "category": ["CodeGeneration"],
     "title": "EvoR: Evolving Retrieval for Code Generation",
     "authors": "Hongjin Su, Shuyang Jiang, Yuhang Lai, Haoyuan Wu, Boao Shi, Che Liu, Qian Liu, Tao Yu",
-    "publication": "Preprint",
+    "publication": "EMNLP Findings 2024",
     "paperLink": "https://arxiv.org/abs/2307.07047",
     "codeLink": "https://github.com/xlang-ai/EVOR",
     "dataLink": "https://huggingface.co/datasets/xlangai/arks_data",
     "blogLink": "https://arks-codegen.github.io/",
     "twitterLink": "https://twitter.com/hongjin_su/status/1759978005525643466",
     "image": "/research/ark.jpeg"
   },
-  {
-    "category": ["CodeGeneration"],
-    "title": "Generative Representational Instruction Tuning",
-    "authors": "Niklas Muennighoff, Hongjin Su, Liang Wang, Nan Yang, Furu Wei, Tao Yu, Amanpreet Singh, Douwe Kiela",
-    "publication": "Preprint",
-    "paperLink": "https://arxiv.org/abs/2402.09906",
-    "codeLink": "https://github.com/ContextualAI/gritlm",
-    "dataLink": "",
-    "blogLink": "",
-    "twitterLink": "https://twitter.com/Muennighoff/status/1758307967802224770",
-    "image": "/research/grit.jpeg"
-  },
   {
     "category": ["DigitalAIAgents"],
     "title": "OS-Copilot: Towards Generalist Computer Agents with Self-Improvement",
@@ -117,20 +117,32 @@
     "dataLink": "",
     "blogLink": "",
     "twitterLink": "https://twitter.com/zywu_hku/status/1758014688779244002",
-    "image": "/research/os-copilot.png"
+    "image": "/research/os_copilot.png"
   },
   {
     "category": ["DigitalAIAgents"],
     "title": "OpenAgents: An Open Platform for Language Agents in the Wild",
     "authors": "Tianbao Xie*, Fan Zhou*, Zhoujun Cheng*, Peng Shi*, Luoxuan Weng*, Yitao Liu*, Toh Jing Hua, Junning Zhao, Qian Liu, Che Liu, Leo Z. Liu, Yiheng Xu, Hongjin Su, Dongchan Shin, Caiming Xiong, Tao Yu",
-    "publication": "Preprint",
+    "publication": "COLM 2024",
     "paperLink": "https://arxiv.org/abs/2310.10634",
     "codeLink": "https://github.com/xlang-ai/OpenAgents",
     "dataLink": "https://github.com/xlang-ai/OpenAgents",
     "blogLink": "https://www.xlang.ai/blog/xlang-intro",
     "twitterLink": "https://twitter.com/ChengZhoujun/status/1714343204148113860",
     "image": "/research/openagents.png"
   },
+  {
+    "category": ["DigitalAIAgents"],
+    "title": "Does Collaborative Human-LM Dialogue Generation Help Information Extraction from Human Dialogues?",
+    "authors": "Bo-Ru Lu, Nikita Haduong, Chia-Hsuan Lee, Zeqiu Wu, Hao Cheng, Paul Koester, Jean Utke, Tao Yu, Noah A. Smith, Mari Ostendorf",
+    "publication": "COLM 2024",
+    "paperLink": "https://arxiv.org/abs/2307.07047",
+    "codeLink": "",
+    "dataLink": "",
+    "blogLink": "",
+    "twitterLink": "",
+    "image": "/research/os-copilot.png"
+  },
   {
     "category": ["PhysicalAIAgents"],
     "title": "Lemur: Harmonizing Natural Language and Code for Language Agents",
@@ -212,6 +224,18 @@
     "twitterLink": "",
     "image": "/research/ce-icl.png"
   },
+  {
+    "category": ["CodeGeneration"],
+    "title": "Batch Prompting: Efficient Inference with Large Language Model APIs",
+    "authors": "Zhoujun Cheng, Jungo Kasai, Tao Yu",
+    "publication": "EMNLP 2023 Industry Track",
+    "paperLink": "https://arxiv.org/abs/2301.08721",
+    "codeLink": "",
+    "dataLink": "",
+    "blogLink": "",
+    "twitterLink": "",
+    "image": "/research/batch.png"
+  },
   {
     "category": ["CodeGeneration"],
     "title": "Binder: Binding Language Models in Symbolic Languages",
@@ -271,66 +295,6 @@
     "twitterLink": "",
     "image": "/research/ic-dst.jpg"
   },
-  {
-    "category": ["DigitalAIAgents"],
-    "title": "NL2INTERFACE: Interactive Visualization Interface Generation from Natural Language Queries",
-    "authors": "Yiru Chen, Ryan Li, Austin Mac, Tianbao Xie, Tao Yu, Eugene Wu",
-    "publication": "IEEE Visualization Conference NLVIZ Workshop 2022",
-    "paperLink": "https://arxiv.org/abs/2209.08834",
-    "codeLink": "https://github.com/learnedinterfaces/PI2",
-    "dataLink": "",
-    "blogLink": "",
-    "twitterLink": "",
-    "image": "/research/nl2interface.jpg"
-  },
-  {
-    "category": ["CodeGeneration"],
-    "title": "GraPPa: Grammar-Augmented Pre-Training for Table Semantic Parsing",
-    "authors": "Tao Yu, Chien-Sheng Wu, Xi Victoria Lin, Bailin Wang, Yi Chern Tan, Xinyi Yang, Dragomir Radev, Richard Socher, Caiming Xiong",
-    "publication": "ICLR 2021",
-    "paperLink": "https://arxiv.org/abs/2009.13845",
-    "codeLink": "https://github.com/taoyds/grappa",
-    "dataLink": "",
-    "blogLink": "",
-    "twitterLink": "",
-    "image": "/research/grappa.jpg"
-  },
-  {
-    "category": ["CodeGeneration"],
-    "title": "Semantic Evaluation for Text-to-SQL with Distilled Test Suites",
-    "authors": "Ruiqi Zhong, Tao Yu, Dan Klein",
-    "publication": "EMNLP 2020",
-    "paperLink": "https://arxiv.org/abs/2010.02840",
-    "codeLink": "https://github.com/taoyds/test-suite-sql-eval",
-    "dataLink": "",
-    "blogLink": "",
-    "twitterLink": "",
-    "image": "/research/test-suite.jpg"
-  },
-  {
-    "category": ["CodeGeneration"],
-    "title": "CoSQL: A Conversational Text-to-SQL Challenge Towards Cross-Domain Natural Language Interfaces to Databases",
-    "authors": "Tao Yu, Rui Zhang, Heyang Er, Suyi Li, Eric Xue, Bo Pang, Xi Victoria Lin, Yi Chern Tan, Tianze Shi, Zihan Li, Youxuan Jiang, Michihiro Yasunaga, Sungrok Shim, Tao Chen, Alexander Fabbri, Zifan Li, Luyao Chen, Yuwen Zhang, Shreya Dixit, Vincent Zhang, Caiming Xiong, Richard Socher, Walter Lasecki, Dragomir Radev",
-    "publication": "EMNLP 2019",
-    "paperLink": "https://arxiv.org/abs/1909.05378",
-    "codeLink": "https://github.com/taoyds/cosql",
-    "dataLink": "https://drive.google.com/uc?export=download&id=1Y3ydpFiQQ3FC0bzdfy3groV95O_f1nXF",
-    "blogLink": "https://yale-lily.github.io/cosql",
-    "twitterLink": "",
-    "image": "/research/cosql.jpg"
-  },
-  {
-    "category": ["CodeGeneration"],
-    "title": "SParC: Cross-Domain Semantic Parsing in Context",
-    "authors": "Tao Yu, Rui Zhang, Michihiro Yasunaga, Yi Chern Tan, Xi Victoria Lin, Suyi Li, Heyang Er, Irene Li, Bo Pang, Tao Chen, Emily Ji, Shreya Dixit, David Proctor, Sungrok Shim, Jonathan Kraft, Vincent Zhang, Caiming Xiong, Richard Socher, Dragomir Radev",
-    "publication": "ACL 2018",
-    "paperLink": "https://arxiv.org/abs/1906.02285",
-    "codeLink": "https://github.com/taoyds/sparc",
-    "dataLink": "https://drive.google.com/uc?export=download&id=1Uu7NMHTR1tdQw1t7bAuM7OPU4LElVKfg",
-    "blogLink": "https://yale-lily.github.io/sparc",
-    "twitterLink": "",
-    "image": "/research/sparc.jpg"
-  },
   {
     "category": ["CodeGeneration"],
     "title": "Spider: A Large-Scale Human-Labeled Dataset for Complex and Cross-Domain Semantic Parsing and Text-to-SQL Task",
 
@@ -1,22 +1,22 @@
 name,institution,link
-Danyang Zhang,Visiting Ph.D STJU,https://zdy023.github.io/
-Ruisheng Cao,Visiting Ph.D STJU,https://rhythmcao.github.io/
-Fangyu Lei,Visiting Ph.D ,https://lfy79001.github.io/
-Dongchan Shin,Intern 2024 HKU,https://scholar.google.com/citations?user=QzZOkfIAAAAJ&hl=en
-Lei Gan,Intern 2024 FDU,https://www.linkedin.com/in/lei-gan-807808292/?originalSubdomain=cn
-Siheng Zhao,Intern 2023 NJU BS → USC PhD,https://hilbert-johnson.github.io/
-Yuhan Liu,Intern 2023 XJTU BS → NYU PhD,https://lyh6560new.github.io/
-Zhoujun Cheng,Intern 2022-23 SJTU BS/MS → UCSD PhD,https://blankcheng.github.io/
+Danyang Zhang,"Visiting PhD 2024, SJTU",https://zdy023.github.io/
+Ruisheng Cao,"Visiting PhD 2024, SJTU",https://rhythmcao.github.io/
+Fangyu Lei,"Visiting PhD 2024, CAS",https://lfy79001.github.io/
+Luoxuan Weng,"Visiting PhD 2023, ZJU",https://luoxuanweng.site/
+Dongchan Shin,"Intern 2024, HKU BS",https://scholar.google.com/citations?user=QzZOkfIAAAAJ&hl=en
+Lei Gan,"Intern 2024, FDU BS",https://www.linkedin.com/in/lei-gan-807808292/?originalSubdomain=cn
+Siheng Zhao,"Intern 2023, NJU BS → USC PhD",https://hilbert-johnson.github.io/
+Toh Jing Hua,"Intern 2023, NTU BS",https://github.com/ztjhz
+Yuhan Liu,"Intern 2023, XJTU BS → NYU PhD",https://lyh6560new.github.io/
+Zhoujun Cheng,"Intern 2022-23, SJTU BS/MS → UCSD PhD",https://blankcheng.github.io/
 Fan Zhou,Intern 2023 SJTU BS/MS,https://koalazf99.github.io/
-Leo Zeyu Liu,Intern 2023 UW BS/MS → UT Austin PhD,https://leo-liuzy.github.io/
-Chen Wu,Intern 2022 THU BS → CMU PhD,https://chenwu.io/
-Ryan Li,Intern 2022 UW BS → Stanford MS,https://www.linkedin.com/in/ryan-li-a9b2761b8/
+Leo Zeyu Liu,"Intern 2023, UW BS/MS → UT Austin PhD",https://leo-liuzy.github.io/
+Ryan Li,"Intern 2022, UW BS → Stanford MS",https://www.linkedin.com/in/ryan-li-a9b2761b8/
 Chengzu Li,Intern 2022 XJTU BS → Cambridge PhD,https://scholar.google.com/citations?user=t_Bwt70AAAAJ&hl=en
 Yiming Wang,Intern 2022 PKU BS → Harvard MS,https://rubywong123.github.io/
-Ming Zhong,Intern 2020 Fudan MS → UIUC PhD,https://maszhongming.github.io/
-Da Yin,Intern 2020 PKU BS → UCLA PhD,https://scholar.google.com/citations?user=n32w34kAAAAJ&hl=en
-Toh Jing Hua,HKU UI,https://github.com/ztjhz
-Luoxuan Weng,ZJU PhD,https://luoxuanweng.site/
-Shuyang Jiang,Fudan PhD,https://pixas.github.io/
-Yuhang Lai,Fudan MS,https://halfrot.github.io/
-Chengxi Li,CUHK PhD,https://baigker.github.io/
+Chen Wu,"Intern 2021, THU BS → CMU PhD",https://chenwu.io/
+Chengxi Li,"Intern 2021, HIT BS → CUHK PhD",https://baigker.github.io/
+Yuhang Lai,"Intern 2021, Fudan MS",https://halfrot.github.io/
+Shuyang Jiang,"Intern 2021, Fudan PhD",https://pixas.github.io/
+Ming Zhong,"Intern 2020, Fudan MS → UIUC PhD",https://maszhongming.github.io/
+Da Yin,"Intern 2020, PKU BS → UCLA PhD",https://scholar.google.com/citations?user=n32w34kAAAAJ&hl=en
@@ -2,5 +2,6 @@ name,titles,image,link
 Yiheng Xu,PhD student;University of Hong Kong,/members/yiheng_xu.jpeg,https://yihengxu.com/
 Tianbao Xie,PhD student;University of Hong Kong,/members/tianbao_xie.jpeg,https://tianbaoxie.com/
 Hongjin Su,PhD student;University of Hong Kong,/members/hongjin_su.jpeg,https://hongjin-su.github.io/
+Jiacheng Ye,PhD student;University of Hong Kong,/members/jiacheng_ye.jpg,https://jiacheng-ye.github.io/
 Xinyuan Wang,PhD student;University of Hong Kong,/members/xinyuan_wang.png,https://xinyuan-wang.github.io/
 Bowen Wang,PhD student;University of Hong Kong,/members/bowen_wang.jpg,https://bowenbryanwang.github.io/