AI/智能体/模型工具 · C++
ggml-org/llama.cpp
LLM inference in C/C++。
存量榜 #78
已读 GitHub / README
累计排名
#78
Stars Top 100
累计 Stars
118,943
当前记录
Forks
20,144
榜单记录
Fork / Star
16.9%
社区复用强度
Open Issues
698
维护压力参考
最后提交
2026-07-01
Excel 记录
项目解读
LLM inference in C/C++。 主题标签包括 ggml。 README 重点章节包括:llama.cpp、Recent API changes、Hot topics、Quick start、Description。
README / GitHub 亮点
- GitHub 描述:LLM inference in C/C++。
- Manifesto / ggml / ops。
- Changelog for libllama API。
- Hugging Face cache migration: models downloaded with -hf are now stored in the standard Hugging Face cache directory, enabling sharing with other HF tools.
适用场景
适合评估 AI 应用、智能体工作流、模型工具链、RAG/提示词工程或 AI 辅助开发场景。
采用前核查
Open Issues 数量较高,需评估维护压力和问题响应速度。
README 摘要
Manifesto / ggml / ops LLM inference in C/C++ Changelog for libllama API Changelog for llama-server REST API Hugging Face cache migration: models downloaded with -hf are now stored in the standard Hugging Face cache directory, enabling sharing with other HF tools. guide : using the new WebUI of llama.cpp