人類AI評估系統Yupp上線,可測試逾500個大型語言模型 發佈日期: 23 6 月, 2025 作者: wellchen2020 去年成立的AI新創Yupp日前正式推出人類評估系統,邀請使用者協助評估全球逾500個大型語言模型,包括ChatGPT、Claude、Gemini、DeepSeek、Grok及Llama 等,也涵蓋了必須付費訂閱的各種Pro與Max模型,並根據使用者的回饋制定Yupp AI VIBE(Vibe Intelligence BEnchmark)排行榜。