All Tags

#多模态 ³ #deepseek ² #GNN ⁴ #大语言模型 ³ #目标检测 ¹ #Transformer ²

DeepSeek-Prover

DeepSeek-Prover-V1.5: Harnessing Proof Assistant Feedback for Reinforcement Learning and Monte-Carlo Tree Search 1.介绍尽管在自然语言领域取得了显著进展，但语言模型在形式化定理证明方面

dj-admin Published on 2025-03-01

LLM #大语言模型 #deepseek

DeepSeek-Math

DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models 1.介绍两个关键内容：利用公开可用网络数据的数据选择管道，大规模数学预训练创建了DeepSeekMath语料库：从Common

dj-admin Published on 2025-03-01

LLM #Transformer #大语言模型

论文汇报0：Retentive Network: A Successor to Transformer for Large Language Models

论文题目：Retentive Network: A Successor to Transformer for Large Language Models 发表时间：2023 arxiv 论文作者：Yutao Sun, Li Dong, Shaohan Huang, Shuming Ma, Yuqin

cdj Published on 2024-11-03

Menu

All Tags

DeepSeek-Prover

DeepSeek-Math

论文汇报0：Retentive Network: A Successor to Transformer for Large Language Models

论文汇报0：Retentive Network: A Successor to Transformer for Large Language Models

论文汇报5：DEST-GNN: A double-explored spatio-temporal graph neural network for multi-site intra-hour PV power forecasting

论文汇报4：Graph Spatio-Temporal Networks for Condition Monitoring ofWind Turbine

Grounded Chain-of-Thought for Multimodal Large Language Models

论文汇报1：RMT: Retentive Networks Meet Vision Transformers

Insight-V: Exploring Long-Chain Visual Reasoning with Multimodal Large Language Models

论文汇报2:Higher-Order Attribute-Enhancing Heterogeneous Graph Neural Networks

DeepSeek-Prover

论文汇报3：Cost-effective fault diagnosis of nearby photovoltaic systems using graph neural networks

DeepSeek-Math