LLM开发必备 2025年2月26日,星期三,晴,第50篇博客。 困扰的问题:在进行RAG、多模态检索的实践中难免要调用大模型,但是由于“网络”和注册等诸多因素,使得我们很难方便调用的Open API。 推荐一个API网站:https://www.dmxapi.com/ ,网站集成了当前主流的大模型的调用方法。 openai接口使用openai库调用大模型: 12 2025-02-26 大模型相关 #LLM #RAG #部署
开工大吉 2025年2月5日,乙巳年正月初八,星期三,晴,第49篇博客/2025年第8篇博客,正式开工!!! 关于DeepSeek以及未来1年有关LLM的一些观点和思考 观点整理自刘焕勇老师,转发切记注明出处! 明天就开工了,针对deepseek,我们静下心来看看,这波造神热度迟早要消散或者翻车。LLM帮大家解决落地问题,让大家有饭吃,有活干,才能 2025-02-05 动机 #生活随笔
2025年1月总结与展望 2025年1月30日,星期四,阴天,这是写的第48篇博客文章。 这个月很忙,主旋律是考试与春节·过年。咱中华文化就是博大精深,按理说,每年的1月、2月都应该是一年的开端,事情的开始阶段所有人的状态都应该鼓足干劲的。但是我们中国人不然,每年的1月、2月,中国人都要过自己的节日——春节。对于全体中国人来说,春节正式一年当中为数不多的放下手里工作回家团聚、休息调整的时光~ 只有过了春节,才真正意味着中国 2025-01-30 动机 #科研心路
梁文锋专访 暗涌Waves专访DeepSeek创始人梁文锋暗涌:互联网和移动互联网时代留给大部分人的惯性认知是,美国擅长搞技术创新,中国更擅长做应用。 梁文锋:我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。过去三十多年 IT 浪潮里,我们基本没有参与到真正的技术创新里。我们已经习惯摩尔定律从天而降,躺在家里 18 个月就会出来更好的硬件和软件。Scaling Law 也在被如此对待。 但其实 2025-01-29 动机 #科研心路 #LLM #前沿讲座
DeepSeek YYDS DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement LearningDeepSeek-AI https://arxiv.org/pdf/2501.12948 多看论文原文,少看自媒体公众号文章的鼓吹宣传! 与普通LLM相比,推理LLM倾向于在回答之前讲问题分解为更小的步骤(推理步骤和思维链),这 2025-01-27 大模型相关 #LLM #MLLM
Graph RAG Graph Retrieval-Augmented Generation: A Survey https://www.arxiv.org/pdf/2408.08921 论文更多侧重理论概念层面,实践落地过程中需要自行体会各个阶段的实现过程。 Abstract通过引用外部知识库,RAG改进了LLM输出,有效地减轻了诸如“幻觉”、缺乏特定领域的知识和过时的信息等问题。但是,数据库中不同实 2025-01-24 大模型相关 #LLM #RAG #多模态 #Agentic RAG
Agentic RAG:A Survey AGENTIC RETRIEVAL-AUGMENTED GENERATION: A SURVEY ON AGENTIC RAG Aditi Singh | Abul Ehtesham | Saket Kumar | Tala Talaei Khoei https://arxiv.org/abs/2501.09136 论文更多侧重于理论概念层面,实践中还会遇到很多问题和bug,需要 2025-01-20 大模型相关 #LLM #RAG #多模态 #Agentic RAG
寒假阅读书单 2025年第一个月的大部分时间都干了个啥2024年12月31号在湖里度过了难忘的跨年晚会,进入2025年1月就完全进入了期末复习周,1月10号完成了期末考试,10-16号留校、回所和导师们汇报完这学期的进度以及后续安排,14号完成了晓飞老师《机器学习》课程的实验报告,16号离校去房山舅舅家住了两天,18号回家。忙忙碌碌地度过了2025年的1月份多半时光,伴随而来的寒假(大概率也是学生时代的最后一个 2025-01-19 动机 #笔记
Attention is all you need 攻坚克难,务必拿下Transformer,彻底搞懂原理 参考教程: [1] 动手学深度学习 [2] Data Whale训练营-手撕Transformer Transformer名字的由来论文的第一作者最喜欢的电影是《变形金刚》 论文的创新点:提出了一个新的简单的网络结构——Transformer,完全依赖于注意力机制而省 2025-01-15 大模型相关 #GPT #深度学习 #NLP
2024年度总结 永远相信美好的事情即将发生 2025年 务必谦虚谨慎 艰苦奋斗 戒骄戒躁写每一篇文章前都要牢牢把握好一个目的:写这个东西的动机是什么,要解决什么问题?毛主席讲过,做文章是要解决问题的。 终点和起点,分别和相聚 - 2024大事记2024年主要经历了两件大事:本科毕业、研究生生涯开启,分别和相聚是这一年的主旋律。 2024年开始认真经营 2024-12-31 动机 #科研心路