《三体》与GraphRag碰撞,物理学的未来何在?
微软开源了 GraphRag 项目,将知识图谱与 RAG 相结合。使用 pip install 安装,详细步骤参考官方文档。输入的 txt 编码需与配置文件一致,一般为 utf-8。为了可视化图谱,需要开启配置文件中的三个选项:
```yaml
snapshots:
graphml: true
raw_entities: true
top_level_nodes: true
```
本文以《三体》第一部为例进行测试。由于成本限制,索引建立阶段仅使用 gpt-4o-mini 抽取实体关系。
```yaml
chat_model: gpt-4o-mini
embedding_model: text-embedding-3-large
```
索引建立完成后,可使用 neo4j 展示分析实体抽取结果,或使用 Python 绘图。top10 实体如下:
[图示]
页:
[1]