Category: Uncategorized

  • 研究计划书

    大概半个月前,站长的Google Cloud绑卡后获得了300刀赠金,一直愁在什么地方花。今天下午随机过程的期中也是随机拿分了……因此我也在反思为什么自学没有想象中那么高效。 正巧今晚重读了叶老师关于“一对一辅导的学习效果极大地优于传统课堂教学”的译文。一个小想法油然而生——大学中「自助式学习」的重要性已经是老生常谈了,那么在大模型性能飞速增强的现在,LLM被高水平学习者有效利用的最佳实践是什么?是能处理杂务,协作研讨,还是连导师的身份也能很好胜任? 于是上课摸鱼弄了个计划书,没有质量和细节,轻喷。 探索前沿LLM模型 (Gemini 2.5 Pro Preview ) 对早期本科生学习工作流、技能发展与个人状态的影响——多元案例研究 1. 背景与研究目的 2. 研究问题 3. 研究方法 4. 时间计划 (初步) 5. 预期成果与产出 站长水平有限,这份计划书只是初稿,期待正式开始前与参与者一起完善研究计划。

  • 六人寝睡眠完全攻略

    我曾见证无数个早八,眼神空洞疲倦,勉强爬起的身影。我曾在凌晨三点的灯光下挣扎着完成ddl,感受咖啡因在血管中奔腾却无法唤醒已经麻木的大脑。我曾在课堂上与沉重的眼皮搏斗,也曾为了一场考试放弃整夜的睡眠。我曾在深夜听见室友被噩梦惊醒的喘息,也曾看到朋友们以熬夜为荣,将睡眠不足视为勤奋的勋章。我曾看着奥巴马骄傲地宣称连续72小时不眠不休,仿佛这是值得赞美的英雄壮举。我曾目睹那些因疲劳驾驶而失去生命的悲剧,也曾看到因睡眠不足而做出错误决策的代价。亲爱的朋友,在我们这个将睡眠视为可牺牲的奢侈品的社会中,我们已经忘记了一个简单的真相:睡眠不是一种选择,而是生存与发展的基础。当我将这些被科学证实却被社会忽视的知识分享给你时,我希望能唤醒你对这个被我们侵犯了一个世纪的自然生理过程的尊重。因为只有拥抱健康的睡眠,我们才能真正释放我们的潜能,活出更丰富、更清醒的人生。全文请见

  • 我——🐟NN:跳出自责,重塑专注

    PS:🐟NN——🐟🐟神经网络(🐟 Neutral Network)🐟🐟是我,神经网络则是一种切断自责的视角,详见正文。 在我的人生中,尤其是在频频受挫的大学生活中,我常常反思一个或许也在困扰大家的问题:当事情搞砸了,我们该如何面对那个不理想的结果,以及那个似乎“搞砸了”的自己? 长久以来,我在自己身上观察到一种普遍的模式——无休止的自责。就像我于首页所写,“依靠意志力透支的灵魂,最终在持续的认知负荷下崩溃”。这种内耗式的自我批评,往往比失败本身更具破坏力。它白白的消耗心力,而不能提供什么帮助。 于是,我开始尝试一种不同的视角,一种或许听起来有些“离经叛道”的视角:在复盘失败时,我把自己想象成一个“无意识的神经网络”。 是的,你没听错。一个基于过往数据训练出来的模型。模型还是太难的话,那我也可以是“函数”。我的每一个行为,每一次输入/输出,难道不都是由过去无数的经历、奖惩、环境信号(即“世界这个数据集”)塑造的吗?如果把“我”看作一个复杂的矩阵,那么批评其中某个特定的“参数”似乎意义不大。重要的不是指责这个“数字”不够好,而是去理解它为何如此。 这个视角并非要推卸责任,恰恰相反,它是我用来切断破坏性自责根系的利器。当我不再轻易地将结果归咎于“我这个人不行”,而是看作“我的这个‘模型’在特定输入下,基于现有‘权重’,产生了一个不符合预期的输出”时,内心便获得了惊人的平静。这让我得以抽身出来,更客观地去“调试”——去关注背后的原理。 以“专注力缺失”为例:一次神经网络的诊断 最近,我深刻感受到“专注力”这个核心能力的流失。这无疑影响了我的效率、健康,甚至偏离了我追求的“make everyday count”的理想状态。如果用传统的“意志力薄弱”来归咎自己,除了徒增挫败感,别无益处。 但当我把自己视为“神经网络”时, 当我切段自责的痛苦之时,诊断变得清晰起来。 何而至此乎?福格行为模型或许是一个解释性不错的理论: 看,问题不再是模糊的“我缺乏专注”,而是变成了具体的系统性症结。能力是主要因素,提示和动机为次要因素。 从“道”到“术”:整合智慧,设计干预 诊断之后,如何“优化模型”?这时,我发现将中国古典哲学智慧与现代行为科学模型结合,能产生奇妙的化学反应。 不得不说,在我贫瘠的高中生活中,古文是为数不多的,在忙碌日常中与宏大主题对话的机会了。因此那些饱含情感、哲学和文采的名句,即使过了许久,依然是强大语义和情感节点。在大脑的“向量空间”里,它们可能与“力量”、“清晰”、“根基”、“希望”、“智慧”等高度积极和基础性的概念紧密相连。正是这一前提,给了我复盘的原始动机。而从结构化记忆,与利用现有通路的角度去看,“道生一,一生二,二生三”提供了一个天然的、有序的层级结构,它在记忆与提取上有着天然的优势。高度的抽象性和普适性,也使其易于嫁接。 最终的方案是,从“道”(愿望)出发,推导出“一”(核心原则),再到“二”(关键领域),最后到“三”(行动杠杆)。 这个过程,就像找到了一个坚固的“碳链”骨架(道生一…),然后将富含实用信息的“碱基对”(B=MAP分析与对策) 精准地附着其上,编码出真正可执行、有意义的行动蓝图。 结语:成为自己心智的架构师 人与计算机的不同,就在于人有着“元认知”,我们可以反思自己的“程序”,并有意识地选择去“重新训练”自己。将自己视为一个可被理解、可被优化的系统,而非一个只能被苛责的“坏小孩”,这本身就是一种解放。它让我们停止内耗,将能量聚焦于建设性的分析和行动。 理解并尊重我们大脑与心灵的自然运作规律,我们才能保持最高效的状态,成为自己认知世界的主人。 这种“神经网络”视角,这种让你回忆起过去的“文化结合”,或许正是我们在这个信息爆炸、却常常感到迷失的时代,找回专注、掌控感和内在宁静的一条有效路径。 下一次,当你面对困境时,不妨也试试问自己:我的“神经网络”接收了什么输入?它的“参数”是如何被训练的?我可以如何调整“训练环境”和“算法”,来引导它产生更好的输出? 愿我们都能成为更懂自己的“心智架构师”。

  • Google AI Studio白嫖指南

    Gemini 2.5 Pro目前每个Tier1的项目有免费的2RPM & 50req/day,有条件绑外国VISA卡的同学们可以激活下Google Cloud,获赠300美元赠金的同时可以免费开三个项目,再在Cherry Studio里添加多个API Key自动负载均衡,即可轻松获得每天150条的用量。这并不需要你实际付款,只要验证你有支付能力,即可获得Tier1资格。 当然有多个账号更好,两个账号即可凑出300req/day。 关于Google Cloud激活的问题,首先需要海外信用卡。其次建议把Google的首选语言改为英文,可以避免一些莫名其妙的bug。 没有条件的同学也可以自己创建一个API Key(Free计划是无门槛,有Google账号即可的),外加在闲鱼五毛一个收Free计划的API key,自己建立号池,四个key即可做到100req/day 接近零成本,就可以把最先进的模型用饱饱,感谢谷圣Free了。

  • LLM用户侧指南

    Abstract LLM正迅速成为代码、数学、写作与其他需求的强大助手。然而,面对层出不穷的模型、复杂的API平台和多样的部署方式,如何根据自身特定需求(如编程辅助、数学解题、文本创作)选择最合适的工具链并有效利用?本篇《LLM用户侧指南》将基于站长的个人经验,深入探讨不同应用场景下的模型推荐,详细介绍通过API平台(如OpenRouter)便捷访问和实现本地部署以保障隐私/控制成本的策略,分享获取免费LLM资源的实用途径,并评测推荐如Cherry Studio等提升交互体验的用户友好型工具。本文作为一份面向非研究型用户的实用指南,帮助读者根据自身需求选择和使用 LLM。 模型推荐 代码/软件工程推荐Claude3.7。Claude一直在中文理解力,速度,性能上有很好的平衡。如果用量大/合租,也可以考虑开官方Pro。Artifacts,Project等功能都非常好用。这也是目前我唯一推荐开20刀会员的模型: 以人工智能导论第二次作业为例,在没有默认提示词的情况下,仅给出作业要求,它就能很好的给出项目框架,并在一个回答内就写完了所有代码 Artifacts也非常便于阅读,复制和上传代码到项目知识库 数学,复杂问题,文字创作等内容,Google的Gemini 2.5 Pro Exp表现最佳。Gemini自2.0Flash以上的模型,都给人很聪明的感觉。这个模型目前还处在实验性阶段,但表现有时会让人十分惊喜,或许是目前最接近SOTA—— Stage of the Art的模型。 它的小弟Gemini 2.0Flash几乎免费不限量使用,解决日常问题也足够了。 开源模型领域,Deepseek V3 0324;Qwen qwq;Google Gemma 3都是不错的选择。Deepseek V3 0324与Claude/Gemini的旗舰模型比起来也有一战之力,没有服务器繁忙的话,可以用用,但另外两个模型毕竟太小(Qwen 32b,Gemma3 27/12/7/4/1B),可能在研究用途和个人微调上比较推荐,但日用还是推荐Claude 3.7,Gemini 2.5pro为主,DS V3 0324为辅。 由于这是一篇针对用户侧的指南,开源小模型不做过多推荐,后续会有专题文章对开源小模型进行介绍,主观推荐,以及个人不严谨Benchmark 平台&本地部署 本地部署,先下结论,对于大多数同学不推荐。 原因无他,即使是售价超过8500的5080显卡,显存也只有16G,装不下Q4量化的Gemma3 27b。常见的游戏本基本上只有8G显存,勉强用用12B q4的模型,遑论核显本。 当然,各家的免费模型其实也不大,比如免费用户可用的GPT 4o-mini,在微软的一篇论文中被曝出只有8B,但这样的模型免费资源太多了,完全没必要再自行部署。 想玩玩本地部署的话,现在可以用LM Studio傻瓜式操作 https://lmstudio.ai 目前使用体验最好的或许还是Claude官方Pro,不过大多数同学难以获取海外手机号和外币支付方式。 Gemini 2.5Pro可以在Google AI Studio免费使用,只要你有Google账号即可。 https://aistudio.google.com/prompts/new_chat 不过AI Studio的界面不太好用。 这个时候就可以请出API了。下面主要介绍三个可以方便获取API Key的平台: 在Google AI…