Компания Jinshi Data сообщила 4 марта, что команда больших моделей Dou Bao недавно выпустила Открытый исходный код SuperGPQA, тест Бенчмарк, обладающий всесторонним и высоким уровнем дифференциации знаний. По информации, этот набор данных построен на оценочной системе, охватывающей 285 уровней магистратуры и содержащей 26529 профессиональных вопросов, которые не только охватывают основные предметы, но и включают в себя такие длинные хвосты, как легкая промышленность, сельское хозяйство, службы и т. д., демонстрируя широкий охват полного спектра предметов и заполняя пробелы в области оценки знаний длинного хвоста.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
2 Лайков
Награда
2
3
Репост
Поделиться
комментарий
0/400
GateUser-530a15b2
· 03-04 05:55
пост интересный, но неправильный, я не вижу никакой информации про trump, это лучший токен
Команда крупномасштабного производства открытого исходного кода тестового набора бенчмарка SuperGPQA
Компания Jinshi Data сообщила 4 марта, что команда больших моделей Dou Bao недавно выпустила Открытый исходный код SuperGPQA, тест Бенчмарк, обладающий всесторонним и высоким уровнем дифференциации знаний. По информации, этот набор данных построен на оценочной системе, охватывающей 285 уровней магистратуры и содержащей 26529 профессиональных вопросов, которые не только охватывают основные предметы, но и включают в себя такие длинные хвосты, как легкая промышленность, сельское хозяйство, службы и т. д., демонстрируя широкий охват полного спектра предметов и заполняя пробелы в области оценки знаний длинного хвоста.