cover figure is generated by black-forest-labs/FLUX.1-dev
西雅图的冬天是被细密的小雨浸透的,又注意到下午四点天就完全黑了,所以也提不起出门的兴致。周一把今年最后一个正式的meeting做完,想到是又是一年的年末,于是还是起来写一点东西。
首先来感谢在NeurIPS前后来西雅图探望本留守儿童的许许多多的朋友们,冬天吃着火锅聊天的感觉真好。火锅是一种很包容的吃法。
在家呆的久了,不免先想到今年的旅行。
年初因为WACV去了夏威夷的大岛,海很美,在近海是接近Tiffany的青色,再远一些就渐渐深邃。和同学凌晨开车去了Mauna Kea,上山穿过了层层浓雾,到达后不幸得知只有四驱车才能登顶,于是在接近山顶的地方停车。山上的风呼啸,我们已经坐在云的上方。云移动的很快,在新生的太阳下是粉色蓝色橙色的不断翻涌的形态。下山的路上浓雾散去,有一道彩虹穿越了云层。Mauna Kea是太平洋最高的山,从海底基部算起就有超过万米高,是世界上最高的山体,可谓火山一角。当天晚上和教授夫妇又爬了一次Mauna Kea观星,这里也是全世界最好的观星点之一。我们参观了一个家庭式经营的小型农场,喝到了Kona咖啡,这是种植在火山坡上的品种,种植区域小而狭长。
从夏威夷回来之后和朋友去了Vegas,机票和酒店都很便宜。蹭到了CES的pass,进去匆匆体验了1200mm焦段的和F0.8的黑科技镜头。Vegas的繁忙在一栋栋综合体Casino里,然而我因为损失厌恶所以也没有做慈善的打算。
Hawaii
Hawaii,Mauna Kea
from friend
冬天在西雅图没有太多多余的时间滑雪,于是去看了小鹿。小鹿很可爱,在冬天会换角,在春天长出一个新的来。附近有一个湖,是属于西雅图的瓦尔登。冷色系是这个城市的底色。今年有好几次极光,我有幸在家中就能看到,紫青色的帷布拉起天幕,点点星光反倒屈尊当起了点缀。
Seattle, Leavenworth
Seattle, Leavenworth
Vancouver,Sea to Sky,from official site
春天在签证过期前去了两次温哥华。在AAAI上给了人生第一个正式talk,结果因为slides放映的问题被迫突然全脱稿。北温很美,我们坐了sea to sky长长的缆车,徒步在雪山森林中,湖面冻成了冰,又铺上了厚厚的雪。温哥华有比西雅图更好的粤菜和中餐,downtown有中山公园。Richmond路边的选举广告是中文的,KTV也十分Chinese。
CVPR前后和国内来的朋友一连去了好几个National Park。
黄石是尤其独特的,我喜欢独一无二的存在。松林绵延,薄雾轻绕。热泉是缤纷的,四周是彩色的光晕,核心是青蓝色。间歇泉又像地心的脉搏,是沉寂已久的宣泄。今年拍出最满意的照片是这一张雾气中的行军。在风吹散蒸腾雾气的瞬间,人群像行军般向远方走去。等待间歇泉喷发的我们就像等着发糖的孩子。第一次知道喷泉也可以有数十米高,像奥特曼一样高。在硫磺刺鼻的气味中我们绕着栈道奔跑。
火山也造就了狭长丰富的峡谷地貌。瀑布在远处挂起,经过峡谷的弯折,到近前已是把梯度磨平了。峡谷的岩壁不是一般的土色,火山岩多样的矿物成分显示出红褐、粉白、金黄。
公园里有鹿,鹿往往成群。也有野牛,往往独身一人,攻击性十足。更有熊,往往是熊妈妈带着熊宝宝。
黄石的旁边是大提顿,是连绵的雪山峰峦。从jackson走刚好是穿过整个park,不必停车。
Yellowstone National Park,Best Picture Award
Yellowstone National Park
Mt Rainer, Seattle
作为WA的神山,rainier目前还是我最爱去的park。事实上整个夏天我去了三次,有融雪前的六月初,融雪中的七月初,和融雪后的八月初。rainer的trail旁会立一根橙色的长竿来指示方向,因为有时并没有修出明显的路。然而当六月初我与rainer初见面的时候,厚雪堆积了超过两米,以至于不得不半途而返。
七月初我再来的时候,野花也已盛开了。skyline是一条环线,从主峰的半山腰出发,沿着锥型的山体切出一条曲线。我们幸运的选择了正确的顺时针方向。上山的路有一些浅浅的雪,朝着主峰前进,像是对着雪山朝圣。下山时甚至直接沿着雪迹滑下去了。
八月初在路上看到了小鹿。rainer最多的是土拨鼠,上蹿下跳,但更多的时候在发呆。
Mt Rainer, Seattle
每次去雪山总要吃韩料,**Yi's Traditional Korean Beef Soup** 这一家的雪浓汤是我最喜欢的,原汤很清淡,需要自己加料。从山上下来之后急匆匆的赶去看独立日烟花。在路边坐在地上吃着迟来的晚饭,人群在身遭川流。
和同学去了Olympic和North Cascade National Park。算是把annual pass回本了。
Firework, Independence Day, Seattle
CVPR long video workshop, Seattle
今年在CVPR有两篇中稿,而更特别的是,这是我第一次参与举办了workshop(25年会再继续举办)。我们关于长视频理解的challenge吸引了几十组参赛者上百次的提交,吸引了越来越多的人关注了长视频理解这一个相对新兴的任务和领域。
从22年刚入门科研时自费去新奥尔良,23年投稿被拒绝,到24年多篇中稿和重度参与,这是我在CVPR实现的进步。
暑假的时候去了湾区在Pika实习,和同学住在stanford的学生宿舍,宿舍里有一只聪明的贪吃小狗。Pika是一家关注视频生成的创业公司。在这里认识了许多优秀的人,从MIT的本科小朋友到已经PhD毕业的大前辈。也第一次接触到了大教授。教授们不仅为人谦和,学术水平和见解也是极高,在投稿ddl期间甚至在修改overleaf上的command语法。我在夏天完成了今年最大的一项基础工作,第一次系统性的对video detailed caption进行了定义和评估,并且探讨了video LMM中visual token的redundancy的问题,给出了很详细的实验曲线。坏消息:一篇实验报告,好消息:写得还行。
Birthday at bay area.
回到西雅图之后从1500刀不包水电的小studio搬进了1200刀包水电的大别墅。平常可以去湖边走走,有明火也可以自己做饭。室友有台湾人和ABC,相处的非常融洽。整个后半年也没有旅行计划,因为签证的原因也不敢离境美国。再次感谢在NeurIPS前后来西雅图探望本留守儿童的许许多多的朋友们。年底提交了phd申请,也对整个research做了re-search和future plan。
2024 important dates
在research上,今年算是继续了video lmm这个领域。但是更多的成长在research外。第一次给talk,第一次参与办workshop,第一次加入初创公司,第一次开始尝试扩大社交圈,第一次写blog,和合作者建立了长期良好的正反馈。还养成了一些个人习惯,比如每天刷完arxiv cs:cv的一百五十篇paper,固定的论文分享(可能考虑建一个长期群),会去健身房,会泡茶加牛奶当奶茶喝。
这不是一篇research oriented blog,大抵还是一个生活流水账。关于research的记录有计划是分为两种blogs,一种是学习苏剑林老师写一些感兴趣的理论向论文的笔记(并且可能成为后续research的先导),另一种是在决定结束一个方向的时候的总结(希望有)。这些都会更新到个人主页上 。