博士开题
博士开题顺利通过✅ 可喜可贺! 虽然讲的磕磕绊绊,但好像很水的样子,不像实验室内部流传的那样「比较难」、「容易挂人」,答辩组老师们也十分和蔼可亲。
日麻、雀魂
6 巡能是什么大牌?/doge [图片]
2025-08-23 霍山大峡谷漂流!全程两个半小时,强烈推荐!和其他船的人激烈水战,由于平时太缺乏运动,回来以后人废了一半。 [图片]
祝贺日本投降八十周年!祝贺我和女朋友在一起七周年! [图片]
旅行
2025-08-01 - 2025-08-08 带着女朋友去云南玩了一星期,作为一个在 5000 米海拔不需要吸氧的人,云贵高原自然是轻松拿捏。女朋友平时不怎么运动,高反也不太严重,且在中后期完全适应了海拔,整趟旅游用了不到一瓶氧气。 这几天每天行程拉满,始终抽不出时间发内容,在回肥前一天晚上终于有了点时间,趁机发条说说先简单记录一下此次旅行。等有空了再把相册补上。 [图片] [链接]
CVPR25
CVPR 又闹大笑话了。 起因是有人发现把 evaluate 的代码中 Dataloader 的参数 shuffle=False 改成 shuffle=True ,会导致准确率掉 40% 左右,因此提出质疑(图 1)。 时隔约一个月后,在另一位网友的催促下,作者终于不得不出来回应(已翻译为中文,见图 2),作者表示:
Using shuffle=True would be a matter for future investigation, which could be valuable for researchers in this domain.
[图片] [链接]
终于 get 了心心念念的 Apple Watch,在此鸣谢女朋友的全款赞助! [图片]
赛博丁真
赛博丁真又一次发表争议言论,如图。对此我想说:「现在何同学求我点个赞,除非视频质量真的很好到我想点赞的程度,否则我就会直接说,抱歉我不想点赞,然后关闭视频。」 不过没有这个机会了,因为我已经把他各平台账号都拉黑了😂。 [图片]
拼图
这几天每天抽出点空闲的时间,断断续续的拼了个 1000 片的拼图🧩:梵高的《星月夜》。非常好看,裱起来以后挂家里~ [图片]
魔方
再破 PB:10.77s 喜闻乐见,今天手感一直很差,但遇到了个比较简单的打乱,运气很好:四步白底 Cross, 三个不用换手的 F,还跳了 P。 记录一下打乱和解法。 [图片] [链接]
博士开题
博士开题顺利通过✅ 可喜可贺! 虽然讲的磕磕绊绊,但好像很水的样子,不像实验室内部流传的那样「比较难」、「容易挂人」,答辩组老师们也十分和蔼可亲。
日麻、雀魂
6 巡能是什么大牌?/doge [图片]
随便逛逛→
2021-08-11 如何在校外使用北邮人 PT 站
完美解决离校后无法使用北邮人 PT 站的问题
2025-06-21 大语言模型训练原理与实践(零):预训练
从头训练一个小型大语言模型
2025-04-20MCPM:让 LLM 调用你电脑上的一切工具
MCPM:高效利用大语言模型的利器
2024-11-09Hackergame 2024 题解(零)
Hackergame 2024,再次喜提二等奖~
2024-10-18GeekGame 2024 题解 (零)
今年的 GeekGame 参赛人数好多,勉强拿个前百,来年再接再厉!
2024-04-11 迁移 WordPress 到静态博客
时隔四年,我终于把博客从 WordPress 迁移到了 Hexo
2024-03-20 自建 docker-mailserver 邮件服务器
用 docker 部署了个邮件服务器~
2024-02-02 重塑密码管理体系 ——Bitwarden 服务端自部署
自部署一个密码管理平台
2024-02-23 一个随 Star 数动态变化的 GitHub 仓库
一个有意思的 GitHub 仓库
2023-09-14 从零开始的麻将 AI 论文复现(零)
写了个麻将 AI,不过暂时只实现了监督学习
2022-05-13 自建一个 ZeroTier 行星 / 卫星服务器
P2P 异地组网神器 ——ZeroTier 的自部署方法
2021-08-06 手搓神经网络系列之 —— 训练模型(完结篇)
用 Numpy 撸了个神经网络
2021-08-11 如何在校外使用北邮人 PT 站
完美解决离校后无法使用北邮人 PT 站的问题
2025-06-21 大语言模型训练原理与实践(零):预训练
从头训练一个小型大语言模型
过去一年提交101592024-10-27 - 2025-11-01
最近一月提交13232025-10-03 - 2025-11-01
最近一周提交2882025-10-26 - 2025-11-01
经典红蓝眼睛问题的思考
部署Qwen3-32B模型并使用Cherry Studio优雅接入的一些尝试
在消费级显卡上部署QwQ-32B模型
动手实现一个医学问答大模型(浅尝检索增强生成方法:RAG)
大语言模型训练原理与实践(七):GRPO算法
大语言模型训练原理与实践(六):DPO算法
大语言模型训练原理与实践(五):RLHF
大语言模型训练原理与实践(四):Reward Model
大语言模型训练原理与实践(三):PPO算法
大语言模型训练原理与实践(二):监督微调(SFT)
大语言模型训练原理与实践(一): BPE分词算法
大语言模型训练原理与实践(零):预训练
策略梯度算法中梯度公式的推导
MCP服务编写实践
MCPM:让LLM调用你电脑上的一切工具
Python随机数的背后:MT19937算法之——实战演练
Python随机数的背后:MT19937算法之——小试牛刀
Python随机数的背后:MT19937算法之——状态恢复
Python随机数的背后:MT19937算法之——算法逆向
Python随机数的背后:MT19937算法之——算法分析
avatar
WindShadow
行所欲行,无问西东。
Catch me!
公告
欢迎来自的小伙伴~(位置信息可能存在延迟)
您当前的IP地址为: 44.193.128.39
您现在距离我大约 12017 公里
调停者(INFP-A)
86% 内倾
外倾内倾
51% 直觉
直觉现实
61% 感性
理性感性
71% 灵活
有计划灵活
90% 坚决
坚决动荡
更新于:1 个月前
那年今日
A.D.2006曾荫权的岳母罗瑞珍逝世
A.D.1778最后一个统治芬兰的瑞典君主古斯塔夫四世出生
A.D.1860沙皇尼古拉一世之妻亚历山德拉·费奥多罗芙娜逝世
A.D.1880魏格纳出生
A.D.1907上海电影制片厂导演吴永刚出生
A.D.1922凯末尔宣布废除苏丹制
A.D.1927广州工人游行示威
A.D.1936日本政治家龟井静香出生
A.D.1952美国进行第一颗氢弹试验
A.D.1954阿尔及利亚战争爆发
A.D.1955西方现代人际关系教育的奠基人戴尔·卡内基逝世
A.D.1968藏传佛教大格西喜饶嘉措逝世
A.D.1973中国体操运动员李小双出生
A.D.2001美国参议院大楼清除炭疽病
A.D.2005中国国民党主席马英九的父亲马鹤凌逝世
A.D.2006曾荫权的岳母罗瑞珍逝世
A.D.1778最后一个统治芬兰的瑞典君主古斯塔夫四世出生
直达评论区开关评论弹幕评论所选内容
随便逛逛切换显示模式繁简转换阅读模式友情链接
看板娘
中午了,工作了一个上午,现在是午餐时间!