人類AI評估系統Yupp上線,可測試逾500個大型語言模型

去年成立的AI新創Yupp日前正式推出人類評估系統,邀請使用者協助評估全球逾500個大型語言模型,包括ChatGPT、Claude、Gemini、DeepSeek、Grok及Llama 等,也涵蓋了必須付費訂閱的各種Pro與Max模型,並根據使用者的回饋制定Yupp AI VIBE(Vibe Intelligence BEnchmark)排行榜。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *