技术栈
llada2.0
hay_lee
19 天前
人工智能
·
语言模型
·
自然语言处理
·
llada2.0
LLaDA2.0:蚂蚁开源业内首个 100B 扩散语言模型
传统扩散模型最早用于图像生成(比如 Stable Diffusion),其原理是从纯噪声开始,通过多步“去噪”逐步还原出清晰内容。过去人们认为这种机制难以用于离散的文本(因为文字不像像素可微)。
一个处女座的程序猿
1 个月前
dllm
·
llada2.0
LLMs之dLLM:《LLaDA2.0: Scaling Up Diffusion Language Models to 100B》翻译与解读
LLMs之dLLM:《LLaDA2.0: Scaling Up Diffusion Language Models to 100B》翻译与解读
我是有底线的