MacOS使用感言
引子 很爽,太爽了。我很久在电子产品上面体验到惊艳感了,MacBook Air算是一个。 越用越爽。 正文 到目前为止,我购买MacBook Air已经有了一段时间了,总的体验下来,我的评价是:办公很舒服。我的MacBook Air主要是用来听网课、看文献和写代码的。 不得不说,MacOS的触控板实在是太好用了,通过简单的设置,可以进行四指滑动切屏,三指拖拽,四指捏合打开应用中心等操作。这里尤其要 ...
阅读更多
一个有关自学的建模
引子 最近一直在想,生活中的学习和机器学习有什么区别。之前闲来无事在操场上闲逛,突然想到了课外学习、基于爱好的学习。 说实话,对于爱好来说,大多数人也是不推荐完全自学的,我个人的体验也是这样——自学往往会造成事倍功半的效果,又会在以后的实践中引入很多的错误习惯。 那么,为什么? 一个粗糙的建模 拿弹吉他来举例子,我们要弹好吉他,实际上是做这样一个事情——把脑子里的乐段,通过手指和吉他的互动,表达出 ...
阅读更多
我们的生活能被矩阵分解吗?
引子 最近在做文化相关的原因,遇到了一个难点——“文化究竟是什么?” 其实这是一个非常有意思的问题,传统机器学习领域研究的步骤通常包括特征提取,也就是给定一个任务,提取一个特征,用这个特征作为某种基向量进行任务的求解。同样,语言也有词向量,将自然语言映射到一个向量空间去进行后续的问题解决。最具有代表性的当属于CV——也就是计算机视觉领域。因为图像天然就可以被表征为RGB——这便是图像空间的基向量。 ...
阅读更多
Rethink AI【7】:RAG与知识编辑
引子 大模型的幻觉问题一直是AI领域的痛点之一,如何去解决这个问题?两个比较简单的方法,分别是“开卷考试”和“开颅手术”。 本篇就记录一些自己的学习笔记和思考。 RAG 所谓RAG,就是Retrieve and Generate的简称,即检索后生成技术。其实RAG本身就是一种类似于搜索引擎的技术,既然大语言模型的上下文长度是有限的,那么我们就把一些外部的知识库进行切分,切分成一系列知识,然后让大模 ...
阅读更多
杂谈与重启的读书计划
哲学是对概念的创造,科学是对功能的创造,艺术是对感觉的创造。 我以这句话开题,是因为这句话是我最认可的一句话之一,这句话类似的说法出自《导读德勒兹》。一切学科都可以被分割为这三个学科的组合,比如数学,就是同时是哲学和科学,当然数学也会给人带来特别的感觉,便也是艺术。当然,这种分割是毫无意义的——因为所有学科都被化为了哲学+科学+艺术。不过,需要注意的是,当我们在谈论哲学、科学和艺术的时候,我们 ...
阅读更多
MacOS使用小记
引子 最近奖学金发下来了,打算用这点钱买点新的电子产品,思来想去发现自己游戏本的续航不够好,甚至撑不过一节课(90min)的时间,通过询问社团内的同学,得知MacBook Air的续航很出色。之前听说过MacOS是一个发展非常成熟的类Linux系统,于是就购入了一台MacBook Air M4 24G+512G。通过这两天的使用,我个人还是非常喜欢MacOS的。 初见印象 这款笔记本非常之轻,非常 ...
阅读更多
Rethink AI【6】:传统序列模型
引子 在Transformer架构流行之前,自然语言的处理,尤其是NER(命名实体识别)等任务,通常是利用传统的序列模型处理的,比如隐马尔可夫模型、条件随机场等。实际上,这些模型的假设通常是——模型的未来状态只与当前状态有关。这类模型的发展以HMM(隐马尔可夫模型)为起始,经过MEMM(最大熵马尔可夫模型),到CRF(条件随机场)为止。这些模型在现在已经很少使用了,不过依然有着意义。本篇就来探讨一 ...
阅读更多
LLM推理的不确定性分析
引子 这篇文章改自我“文本理解”课程的pre。 参考的文章有两篇,第一篇是NeurIPS 2025 Oral的论文Give Me FP32 or Give Me Death? Challenges and Solutions for Reproducible Reasoning,第二篇是Thinking Machines提出的技术报告Defeating Nondeterminism in LLM ...
阅读更多
Algorithms【5】:滑窗算法
前言 滑窗算法常用于序列的连续子序列的处理。通过两个指针维护一个窗口,通过一些逻辑对这个窗口——亦即一个连续的子序列——进行处理。 简单的例子:最长无公共字母的子串 这道题可以通过LeetCode 3访问,一个AC解是: 12345678910111213class Solution: def lengthOfLongestSubstring(self, s: str) -> int: ...
阅读更多
Algorithms【4】:链表
前言 链表是一个不常使用在日常软件开发中的数据结构,但是,却经常会被用于出算法题,这是因为,链表的两个元素之间是通过next指针相连,如果没有维护好这个指针信息,就会导致无法访问到某一元素。 我们一般使用单向链表,其中每个元素的结构包括一个data变量和一个next指针,前者用于存储数据,后者用于记录下一个元素的地址,C语言的表示为: 1234typedef struct LinkedListNo ...
阅读更多