英特尔 14 代 ultra 系列 cpu ,京东上小新显示支持 200 亿参数。ollama 的几个模型最大的那个可能内存上不够,不过想知道 ultra 系列的 ollama 运行大模型的速度如何。有人可以分享一下吗
我用的 7840H 的本子,倒是可以运行,回答问题基本上是几分钟才能回答完毕。
https://github.com/ollama/ollama?tab=readme-ov-file