AI/智能体/模型工具 · C++

ggml-org/llama.cpp

LLM inference in C/C++。

存量榜 #78 已读 GitHub / README
累计排名 #78 Stars Top 100
累计 Stars 118,943 当前记录
Forks 20,144 榜单记录
Fork / Star 16.9% 社区复用强度
Open Issues 698 维护压力参考
最后提交 2026-07-01 Excel 记录

项目解读

LLM inference in C/C++。 主题标签包括 ggml。 README 重点章节包括:llama.cpp、Recent API changes、Hot topics、Quick start、Description。

README / GitHub 亮点

  • GitHub 描述:LLM inference in C/C++。
  • Manifesto / ggml / ops。
  • Changelog for libllama API。
  • Hugging Face cache migration: models downloaded with -hf are now stored in the standard Hugging Face cache directory, enabling sharing with other HF tools.

适用场景

适合评估 AI 应用、智能体工作流、模型工具链、RAG/提示词工程或 AI 辅助开发场景。

采用前核查

Open Issues 数量较高,需评估维护压力和问题响应速度。

README 摘要

Manifesto / ggml / ops LLM inference in C/C++ Changelog for libllama API Changelog for llama-server REST API Hugging Face cache migration: models downloaded with -hf are now stored in the standard Hugging Face cache directory, enabling sharing with other HF tools. guide : using the new WebUI of llama.cpp