技术栈

llada2.0

hay_lee
19 天前
人工智能·语言模型·自然语言处理·llada2.0
LLaDA2.0:蚂蚁开源业内首个 100B 扩散语言模型传统扩散模型最早用于图像生成(比如 Stable Diffusion),其原理是从纯噪声开始,通过多步“去噪”逐步还原出清晰内容。过去人们认为这种机制难以用于离散的文本(因为文字不像像素可微)。
一个处女座的程序猿
1 个月前
dllm·llada2.0
LLMs之dLLM:《LLaDA2.0: Scaling Up Diffusion Language Models to 100B》翻译与解读LLMs之dLLM:《LLaDA2.0: Scaling Up Diffusion Language Models to 100B》翻译与解读
我是有底线的