Andyyyy64/whichllm
商业评分 73 · 验证评分 48 · EXPERIMENTING
用户(尤其中文场景下的开发者、研究者、企业 IT)需要在本地硬件上挑选'能跑且表现最好'的开源大模型,但现有工具(LM Studio、Ollama、llama.cpp)只按参数规模或 VRAM 适配度推荐,忽视真实基准分、量化效率、代际新旧,且无中文基准权重(SuperCLUE/C-Eval/CMMLU)与国
aiapple-siliconbenchmarksclicommand-line-toolggufgpuhuggingface
查看 GitHub 仓库
目标用户痛点
用户(尤其中文场景下的开发者、研究者、企业 IT)需要在本地硬件上挑选'能跑且表现最好'的开源大模型,但现有工具(LM Studio、Ollama、llama.cpp)只按参数规模或 VRAM 适配度推荐,忽视真实基准分、量化效率、代际新旧,且无中文基准权重(SuperCLUE/C-Eval/CMMLU)与国产模型(通义/DeepSeek/ChatGLM/智谱/百川)优先级。whichllm 已用基准融合 + 真实评估 + 自动硬件检测部分解决技术问题,但商业缺口中文化、团队化、托管化的覆盖。
需求信号
GitHub 端有真实需求信号:5460 stars、288 forks、18 open issues、最近推送 2026-06-29,属于成熟工具的活跃维护期;但 8 个 open 验证动作均未完成,无 done_signal、无 payment_signal、无 customer_count 记录。外部市场证据(HN/Reddit/Product Hunt/YouTube/X/Google Trends)全部为空或仅占位,说明虽有产品热度但缺乏可被搜索/讨论的扩散势能。结论:产品端有 PMF,商业端需求未被验证。
变现路径
0 付费信号、0 客户数、0 完成验证动作。提案中的 4 条商业路径(模板包 ¥99-299、代部署服务 ¥299-999、SaaS 订阅 ¥29-499/月、行业方案 ¥2999-7999)均为假设定价,无 anchor customer 验证。开源项目本身的赞助(GitHub Sponsors)也未见显著流水证据。LM Studio/Ollama 持续免费且积极迭代,意味着任何订阅类产品都需强烈差异化才能落地。
7 天验证测试
可执行 7 天 MVP:1) 中文场景模板包(5-8 个 YAML profile,覆盖 24GB/16GB/M 系列/4090/CPU-only,内置 SuperCLUE+C-Eval+CMMLU 权重与国产模型优先级);2) 一页式中文 README + setup.sh,目标 10 分钟跑出中文 Top3;3) 同步在飞书/钉钉部署机器人小工具推送新模型与基准更新。退出标准:14 天预售 30+ 套或收到 5+ 付费定制咨询;未达成则降级为社区维护模式,不再投入商业化。