五一五更之四:动手学GPT 学习知识就像是水流一样,一定要找到知识的源头和知识的流向;也就是说,不仅仅要关注当前这篇文章的创新点,同时也要关注当前的这篇文章前期工作有什么,思路是从哪些文章延伸过来的;而流向就是基于现有知识作出的创新。 为什么现在的大语言模型都是Transformer架构? Transformer模型本身里面的inductive bia 2025-05-04 大模型相关 #LLM #深度学习
五一五更之三:动手学BERT 基于Bert-base-chinese的中文文本分类BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding:https://arxiv.org/pdf/1810.04805 安装必要的第三方库1root@autodl-container-7a964b9870-ea0546ee:~# pip i 2025-05-03 大模型相关 #LLM #深度学习
五一五更之二:注意力机制的起源与发展 注意力机制的起源与发展注意力是我们人类特有的功能之一,这半年读周岭老师的《认知觉醒》、《认知驱动》时候对注意力这个词产生了很深的印象。 人类情绪和能力的优劣差异来自于对自身注意力关注方式的差异。注意力是一种深度沉浸的能力,从大范围看,沉浸能力强的人时常处于支配层,沉浸能力弱的人时常处于被支配层。 在聚精会神的状态下,人类大脑的前额叶皮层就会自动沿着神经通路传递信号,这些信息会奔向与我们思考内容相关 2025-05-02 人工智能与深度学习 #深度学习
五一五更之一:2025年4月总结与展望 五一放假回老家了,在家呆着也舒服,也不舒服。 舒服在于安心,回来无忧无虑,家是唯一的城堡;不舒服在于,竟然被弟弟妹妹们催婚了卧槽?!我爸我妈都没发表意见,被小一辈开始攻击了😭 并不友好的人间4月天4月,大风、多雨。 天气起起伏伏,状态也是起起伏伏😑 这个月很焦虑,因为实验跑了一坨屎;深刻理解了Kaiming那句话:科研95%的时间都是沮丧的。(短短一句话,一个月的辛酸全部囊括了,无论多努力:) 2025-05-01 动机 #科研心路
没有饺子全是醋 2025年4月28日,星期一,晴天☀️,第60篇博客。 这学期的第一门课结束了,王老师作为一名科研工作者和互联网一线老兵分享了他的人生感悟。没有饺子全是醋,收好这份《科研生活指南》~ 鸡汤只留给需要喝它的人,宝剑只留给能够挥舞它的人,在强调一遍,没有饺子都是醋~ 少一些书生气,多一些江湖气 人 主动去学,问;先动起来,干中去事上练 成绩导向过渡到利 2025-04-28 动机 #科研心路 #前沿讲座
湖仓一体技术调研 湖仓一体技术调研 中国科学院大学计算机科学与技术学院 2025春·大数据系统与大规模数据分析 授课老师:陈世敏老师(https://www.shimin-chen.com/index-gb.html) 授课老师:孙翼老师(https://people.ucas.ac.cn/~0002034) _DataLake小组:杨桂淼(组长)、王子曰(成员1)、王晓妍(成员2) 前期任务及 2025-04-25 论文研读 #big data #分布式计算 #存储 #数据仓库 #数据湖
沐神论文阅读速览 2025年4月15日,星期二,晴天☀️,第58篇博客。 这篇Blog耗时长,花费了很大精力和心血,但是感觉一切都值得、有价值! 跟着李沐读经典论文今天听了大老师讲文献阅读课后很受启发,主要讲了文献阅读的方法以及如何找idea。 WWH → IDEA why:为什么要做这个研究? what:研究发现了什么? how:研究时如何实施的,用了什么方法? 明确科研目的 - 结果导向 以终为始 看文献 2025-04-15 论文研读 #LLM #人工智能 #MLLM
Ask in Any Modality 2025年4月1日,星期二,晴天☀️,第57篇博客。 Ask in Any Modality:多模态检索增强生成的研究综述本研究综述提供了对Multimodal-RAG系统的结构化和全面分析,涵盖了数据集、度量、基准、评估、方法以及检索、融合、增强和生成方面的创新。 研究对多模态检索增强生成(多模态 RAG)系统进行了深入分析。这些系统通过整合来自文本、图像、音频和视频等各种来源的外部动态信息来增 2025-04-05 大模型相关 #RAG #MLLM #多模态
王坚院士最新访谈录 2025年3月3日,星期一,阴天,第52篇博客。 谈谈阿里(我眼中的) 王坚:中国工程院院士,云计算技术专家,之江实验室主任,阿里巴巴集团技术委员会主席 我是一直看好阿里的,从本科接触到大数据技术以来,我就在一直慢慢探索大数据技术领域的领先技术。随着短视频爆火、电商领域重大变革,马老师退居二线“靠边站”,阿里系内部也有人事重大调整,很多人唱衰阿里。 2025-04-01 动机 #科研心路 #前沿讲座
2025年3月总结与展望 2025年3月31日,星期一,晴天☀️,第56篇博客。 3月的最后一周,难受3月最后一周非常难受,因为这周一整个周都没好天气,天气忽冷和热的给我整的很不适应,一周也没打球训练。。。 花粉过敏一直流鼻涕、打喷嚏,难受死我了。在北京的第一个春天,没想到会花粉过敏😢 上周一周为了跑实验、设计实验代码,熬夜/不按时吃饭、暴饮暴食又把胃口搞坏了 总之,3月的最后一周过的很衰。。。 但是,总体来看 2025-03-31 动机 #科研心路