介绍
在工作和学习的时候发现,很多时候挑选合适的模型和数据集等也是一个重要且麻烦的过程。发现有很多相关的评测的排行榜,根据这些实时更新的排行榜,可以辅助我们进行选择模型等前期工作。
这里罗列了许多关于ai的最新新闻,也能搜索到各种排行榜leaderboard。
nlp任务
MTEB Leaderboard - a Hugging Face Space by mteb
Massive Text Embedding Benchmark (MTEB) ,是关于文本嵌入的排行榜,同时关注排行榜的like人数(从某种意义上反应排行榜的效用)。
大模型评测
Open LLM Leaderboard - a Hugging Face Space by HuggingFaceH4
这里提供了各种关于大模型在多维度的数据集上的表现能力,并且支持根据大模型的类型、精度等过滤大模型排行榜。
Big Code Models Leaderboard - a Hugging Face Space by bigcode
这里提供了关于大模型code能力的排行榜。
LMSys Chatbot Arena Leaderboard - a Hugging Face Space by lmsys
这里提供了关于大模型对话能力的排行榜(但是由于不知名原因暂时无法打开)。
Chat with Open Large Language Models (lmsys.org)
这里是关于大模型对话能力的测评网站,也提供了参考用的排行榜。
LLM-Perf Leaderboard - a Hugging Face Space by optimum
这里提供了大模型在给定硬件条件的训练资源后微调的性能排行榜。
Open CoT Leaderboard - a Hugging Face Space by logikon
这里提供了关于大模型CoT(Chain of Thought)的排行榜。
Since the comment system relies on GitHub's Discussions feature, by default, commentators will receive all notifications. You can click "unsubscribe" in the email to stop receiving them, and you can also manage your notifications by clicking on the following repositories: bg51717/Hexo-Blogs-comments