munger写字的地方

2024年度总结

永远相信美好的事情即将发生 2025年务必谦虚谨慎艰苦奋斗戒骄戒躁写每一篇文章前都要牢牢把握好一个目的：写这个东西的动机是什么，要解决什么问题？毛主席讲过，做文章是要解决问题的。终点和起点，分别和相聚 - 2024大事记2024年主要经历了两件大事：本科毕业、研究生生涯开启，分别和相聚是这一年的主旋律。 2024年开始认真经营

2024-12-31

动机

#科研心路

2024年12月总结与展望

2024年12月总结与展望

11月任务回顾2024年最后一个月，主要任务就一个：把之前深度学习所有相关知识整合、查漏补缺、复现Coding 今天5号了，这个月的任务除了复习最后的三门课之外，更多的精力要分配给如下任务：卷积神经网络学习(还剩VGG、ResNet没有实现) 语言神经网络学习多读经典论文、多复现代码(循环神经网络、Attention、Transformer、BERT掌握) 精进python、C+

2024-12-31

动机

#科研心路

机器学习与大数据管理总结复习

有题库就不再总结零散的知识点，重点看自己不熟悉的地方过拟合：一味追求提高对训练数据的预测能力，所选模型复杂度往往会比真实模型高。学习时选择的模型包含参数过多，以至于出现这一模型对已知数据预测的很好，但对未知数据预测的很差的现象。 K折交叉验证：随机地将已给数据切分为K个互不相交的大小相同的子集；然后利用K-1个子集的数据训练模型，利用剩下的子集进

2024-12-25

人工智能与深度学习

#期末总结

自然语言处理基础总结复习

理解自然语言处理领域的基础技术与核心任务什么是实体？怎样理解序列？ Entity vs Object；实体是“某种概念”的实例化，比如一个具体的地名、人名，我觉着实体其实和面向对象中对象的概念相似，就是一个东西，一个具体的东西。广义的序列我认为可以理解为一串文字序列，一串经过嵌入后的文本向量。词性标注：基于机器学习的方法，往往需要对分词后的词进行词性标注，词性一般包括动词、形容词、名词。标注

2024-12-25

人工智能与深度学习

#期末总结

RAG综述一览

参考文章：https://mp.weixin.qq.com/s/lbeeblGYvb1JeC0gW4AE9g 2025.02.23的自我批评：其实这篇综述文章早就应该写出来，但是就是一直拖着，结果一直到现在才想着去完善。最主要的原因是因为DataWhale发布了一篇推文，全面的梳理了RAG范式发展，与当初自己的思路不谋而合。所以，这学期一定不要拖延，想的事情就赶紧去做！！！三篇关键的综述[1]

2024-12-18

论文研读

#RAG #LLM

Multi-agent RAG Systems调研报告

Multi-agent RAG Systems调研报告

Agentic RAG调研报告—探索搭建适配多数据源的Multi-agent RAG SystemMulti-agent RAG架构设计应用场景与需求根据不同的知识库与应用特点构造了不同的查询引擎，它们面向不同的领域知识，采用了不同的索引(比如VectorIndex与GraphIndex)。我们需要给使用者(可能是人或应用)提供一致性体验，他们无须关心后端使用的真实查询引擎是哪一个，只需要输入问题

2024-12-18

人工智能与深度学习

#RAG #LLM #多模态

Agentic RAG with LlamaIndex

Agentic RAG with LlamaIndex

传统RAG作为一个首次接触RAG的开发者，简单理解RAG就是给LLM外挂一个知识库。可笑的是记得第一次开组会给两位导师将MMLMs RAG System的综述博客，讲完以后导师问我如何通俗理解RAG，能不能举一个例子。我停顿了3秒，尴尬地说讲不出来。讲不出实际的应用案例，说明你对这个领域内的知识、方法还不够理解。老师随后说：LLM知道杨桂淼是谁吗？我说：不知道。老师接着说：如何事先已经把杨桂

2024-12-10

人工智能与深度学习

#RAG #LLM #Agent #GPT

Multimodal RAG and Prompt Compression

Multimodal RAG and Prompt Compression

Multimodal RAG与Prompt compression再梳理Multimodal RAG System Work Flow多模态RAG的完整工作流如下图所示：再次梳理一遍多模态RAG系统的工作流程： 1.多模态信息输入—2.特征提取—3.特征融合—4.信息检索—5.上下文构建—6.生成答案 1.加载所有文档，并使用类似unstruc

2024-12-08

人工智能与深度学习

#RAG #LLM #多模态

动手学循环神经网络

动手学循环神经网络

由于pytorch已经将三个循环神经网络、LSTM进行了高度的封装，所以本节不再去关注网络结构的设计和复现，而是重点关注如何在自己设计的网络结构中将RNN和LSTM融入进去以实现特等的任务。卷积神经网络是借鉴人类视觉的思想，教会计算机识别东西；从循环神经网络开始，我们的核心任务就是教会计算机理解序列数据。人类并不是每时每刻都从头开始思考。当我们阅读这篇文章时，会根据对前面单词的理解来理解每个

2024-12-06

人工智能与深度学习

#深度学习

2024年11月总结与展望

2024年11月总结与展望

消失的半个月，难得喘口气折腾了半个月的分布式文件系统期末结课结课实验，终于汇报结束了。第15周了，很多课程都是实验节课，最近半个月实验压力也别大。但是好在昨天把大数据的实验和C++的实验都完成了，周六还有一场英语考试，紧张刺激的15周就终于要迎来胜利的曙光了！这半个月主要在忙这些事，科研搁置了很多。今天开始，我要把失去的，都补回来哈哈哈哈！！最后一个月的工作重心转移到MLLMs RAG pr

2024-12-05

动机

#科研心路