ollama+Obsidian, 自定义构建本地AI 写作助理,不用联网

112 0 0

ollama+obisidian 能够读取obsidian 的所有文档,直接在 obsidian 实现本地知识库问答和大模型对话

对于像我这样的用 obsidian 作为写作工具的文字工作者来说, 这个组合实在是很有用,我在写文章时就下载了 ollama,并用 ollama 下载了 4 位量化的 llama 70B 模型, 只占 30G 内存,运行速度是很快的

ollama 配置直接去 ollama 官方就有下载教程, 先把 app 下载了,在在终端运行ollama run llama3:70b

不同的模型内容质量不同,这里以 ollama 做示例, 中文内容笔记多的话,还是找个开源的中文 LLM,最近综合能力比较好的就是 qwen,详见下图

ollama+Obsidian, 自定义构建本地AI 写作助理,不用联网

ollama 下载完模型,app 打开后,就在 obsidian 搜索插件”Smart Second Brain”,安装后在配置里选择 chat Model,你下载了哪个模型,选项里就会有该选项,向量模型embedding model可以先随便选, 稍后会解释怎么下载

ollama base URL 也可以不管,是 ollama 默认的base URL exclude filed 用来设置不想被大模型访问的文档

ollama+Obsidian, 自定义构建本地AI 写作助理,不用联网

设置好上面后,回到写作页面,在最左边点击对话气泡框,弹出 Smart Second Brain 的窗口后,按照步骤操作就行

ollama+Obsidian, 自定义构建本地AI 写作助理,不用联网

在执行到第8个步骤时会让你设置向量模型,你直接点按,就会自动下载 ollama 的向量模型,默认是 nomic-embed-text,据 ollama 官方说,在长短文本表现效果超过了openai 的text-embedding-ada-002和text-embedding-3-small

“

nomic-embed-text is a large context length text encoder that surpasses OpenAI text-embedding-ada-002 and text-embedding-3-small performance on short and long context tasks.

模型大小 300M,下载不会花太长时间,下载完后就自动开始向量嵌入 obsidian 里的 md 文档,40 篇 2k 字的文档需要 30s

可以设置 creativity,数值越大,回答内容越发散,适合初期写文稿让 ai 提供选题, 主旨这些需要创造性的用途,similarity 是设置LLM 检索的文档内容跟用户问题的匹配度的, 数值越大, LLM 检索的内容跟用户问题更精准

这里用英文测试RAG 水平, llama3:70b 之前测试了问中文容易说英文, 就用英文内容测试,刚好最近看完“Bresson on Bresson Interviews 1943–1983”整理了一篇要点

让他回答 Robert Bresson 对待 50mm 镜头的态度, 结果并没有根据左边的笔记文档知识库回答的, 而且还没有在终端直接问的单纯的 llama3:70b 回答质量高

ollama+Obsidian, 自定义构建本地AI 写作助理,不用联网

obsidian.png

怪不得 llama3 70b排名很高, 训练数据内容都比我写的丰富, 像不需要实时网络搜索和知识库问答的, AI 辅助写作提供灵感,素材的, 这样部署就很实用, 直接在笔记右侧对话就行,不需要切换其他平台,而且不用联网, 运行和数据都在本地

我要写读书笔记就完全可以利用好 obsidian 的 ollama,下图是ollama 里的llama3 70b写的读书笔记

ollama+Obsidian, 自定义构建本地AI 写作助理,不用联网

虽然向量解析全部文档来进行知识库问答的回答质量特别低 ,但是可以就单篇文章进行提问,直接用[[]] obsidian 自带语法就可以连接到文档,还是稍微能根据文章中的内容回答

ollama+Obsidian, 自定义构建本地AI 写作助理,不用联网

你想要能联网的 LLM 来提供素材,国内可以用 kimi 和秘塔的 api(需要付费,之前用LLM red team 的免费 api,用了几天账号就被 kimi 封禁了,再也登不上)

这两家模型自身就有实时网络搜索的能力,能返回真实存在的链接 , 问题是目前 obsidian 很多LLM 相关插件都不支持国产商用模型,支持的大多都是开源模型,或者像 ollama,LM studio 的本地大模型集合工具以及国外知名度高的GPT,Gemmi ,Claude等商用模型

obsidian LLM 插件有这里提到的 Second Smart Brain,还有 Copilot,BMO ChatBot等, 其中 BMO chatBot 支持的模型更多,包括商用模型和开源模型,并且可以直接在 obsidian 写模型的 prompt

ollama+Obsidian, 自定义构建本地AI 写作助理,不用联网

BMO chatbot

总的来说,把 llm 接入 obsidian,对在 obsidian 写作人来说,至少有以下 3个好处:

LLM提供写作思路,灵感,素材和标题参考

LLM 能优化句子表达

LLM 画图提供配图

这些能力都要看大模型自带的能力,有的大模型自带了 ai 画图能力,有的大模型就没有,要根据自己需求找到适合自己的大模型

提升改进点

想办法让 obsidian对接到自带联网功能的大模型 api , 如kimi,metaso, 或者想办法让大模型能进行工具调用, 连接搜索插件

RAG 对现有文档进行知识库问答, 因为问答最好知识库是问答对形式的,而不是随意的文档, 这样问答质量会减分: 缺少一个能高质量检索doc 文档内容的模型

下面两点能做到的话, 还用啥notion啊 ,好多 RAG 相关产品都可以 pass

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

ollama+Obsidian, 自定义构建本地AI 写作助理,不用联网