@@ -18,6 +18,7 @@ cntext 是专为**社会科学实证研究者**设计的中文文本分析 Pytho
1818 - 两行代码训练领域专用词向量(Word2Vec/GloVe):`` ct.Word2Vec() ``
1919 - 构建概念语义轴(如“创新 vs 守旧”):`` ct.generate_concept_axis() ``
2020 - 通过语义投影量化刻板印象、组织文化偏移:`` ct.project_text() ``
21+ - 计算文本对应的词嵌入投影得分WEPA:`` ct.wepa() ``
21224 . ** 融合大模型进行结构化分析**
2223 - 调用 LLM 对文本进行语义解析,返回结构化结果(如情绪维度、意图分类):`` ct.llm() ``
2324
@@ -61,7 +62,6 @@ cntext2.x 含io、model、stats、mind五个模块
6162| *** model*** | *** ct.glove2word2vec(glove_file, word2vec_file)*** | 将GLoVe模型.txt文件转化为Word2Vec模型.txt文件; 一般很少用到 |
6263| *** model*** | *** ct.evaluate_similarity(wv, file=None)*** | 使用近义法评估模型表现,默认使用内置的数据进行评估。|
6364| *** model*** | *** ct.evaluate_analogy(wv, file=None)*** | 使用类比法评估模型表现,默认使用内置的数据进行评估。|
64- | *** model*** | *** project_word(wv, a, b, weight=None)*** | 在向量空间中, 计算词语a在词语b上的投影。|
6565| *** model*** | *** ct.load_w2v(wv_path)*** | 读取cntext2.x训练出的Word2Vec/GloVe模型文件 |
6666| *** model*** | *** ct.expand_dictionary(wv, seeddict, topn=100)*** | 扩展词典, 结果保存到路径[ output/Word2Vec] 中 |
6767| *** model*** | *** ct.SoPmi(corpus_file, seed_file, lang='chinese')*** | 共现法扩展词典 |
@@ -85,6 +85,7 @@ cntext2.x 含io、model、stats、mind五个模块
8585| *** mind*** | *** ct.sematic_projection(wv, words, c_words1, c_words2)*** | 测量语义投影 |
8686| *** mind*** | *** ct.project_word(wv, a, b)*** | 测量词语a在词语b上的投影语 |
8787| ** mind** | *** ct.project_text(wv, text, axis, lang='chinese', cosine=False)*** | 计算词语文本text在概念轴向量axis上的投影值|
88+ | *** mind*** | *** ct.wepa(wv, text, poswords, negwords, lang='chinese')*** | 计算文本在概念轴上的投影得分,返回wepa得分|
8889| *** mind*** | *** ct.sematic_distance(wv, words, c_words1, c_words2)*** | 测量语义距离 |
8990| *** mind*** | *** ct.divergent_association_task(wv, words)*** | 测量发散思维(创造力) |
9091| *** mind*** | *** ct.discursive_diversity_score(wv, words)*** | 测量语言差异性(认知差异性) |
0 commit comments