在数据的调味中探寻秘密,再次点燃 LLM 美食节的激情!欢迎踏入第二届 Data-Juicer 数智大赛:“BetterMixture - 大模型数据混合挑战赛”。

 

亲爱的数据大厨们,继上次 FT-Data Ranker 厨艺的精彩亮相后,是时候挑战更加精细的调味技巧了!如何从数不胜数的数据原材料中,巧妙选择、精心混合,才能创造出最适合大模型口味的美食?这就是本届比赛的核心挑战!

 

在 BetterMixture 赛事中,您将扮演一位数据调味大师,利用主办方提供的候选微调数据集,融合您的智慧与经验,设计最佳的数据配比智能采样方案。利用这份经过您巧手混合的调味料(微调数据集),对基础大语言模型进行高效率的微调,释放其隐藏的强大潜能。

 

为了支持您的创作,Data-Juicer 再次披挂上阵,为您提供一站式、系统化、可复用的数据加工工具和算子,以便您迅速上手、并焕发创意。我们细心准备的 Jupyter Notebook 将引导您快速了解比赛流程,让您一路畅通无阻。

 

 

 

 

 

在这场“料理”竞技场上,每位参赛者都将面对相同的挑战规则,包括模型、训练算法等,确保公平竞争。在这里,您不需要庞大的计算设备,单卡 16G 显存即可玩转大模型数据混合,让您轻松驾驭数据的海洋。无论是新锐数据工程师还是资深机器学习专家,都能在这个赛场上一展自己的才华。

 

参赛者不仅有机会赢得丰厚的现金奖励,更能与全国各地的同行们一较高下,激烈角逐。这不仅是一场比赛,更是一个深入探索数据混合策略和推动大语言模型发展的绝佳机会。

 

准备好您的“调味”技巧吧,第二届 Data-Juicer 大模型数据挑战赛已经拉开帷幕。加入我们,共同揭开数据与大模型协同演进的新篇章!更多信息请访问比赛官网,期待您的精彩加入!

 

 

比赛官网:

https://tianchi.aliyun.com/competition/entrance/532174

 

Data-Juicer 开源代码:

https://github.com/alibaba/data-juicer

 

点击直达报名:BetterMixture - 大模型数据混合挑战赛_算法大赛_天池大赛-阿里云天池的赛制 (aliyun.com)

Logo

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!

更多推荐