Try Out Claude 3.7

Try Out Claude 3.7

2025年2月25日,Claude 发布了 3.7-sonnet 版本,Cursor 第一时间更新了模型支持,于是我们就尝试一下这个业界在 Coding 领域最先进的AI成果。 Software Engineering 根据官方介绍,Claude 3.7 Sonnet 在 SWE-bench Verified 测试中取得了最先进的成绩,该测试用于评估 AI 模型解决现实世界软件问题的能力。 我尝试了以下提示词,并手绘了一张概念图手稿,希望 Claude 可以结合我的要求和手稿进行生成一个我有在脑海中构思过,来原于生活的关于两个城市互动的卡片应用生成。 服务不稳定 这是我遇到的第一个问题,不知道是 Cursor 的问题,还是 Claude 的压力过大,过程中频繁出现连接超时的情况,去到 Cursor 的官方论坛也确实发现不少人在抱怨,希望在后续版本中能得以改善,但这也给了我一个启示,那就是在这个 AI 赋能开发的时代,服务稳定性也将是一个不得不考虑的风险。 成果 经过几次尝试,虽然没有像有些人吹嘘的那样一次成型,但终于是得到了一个还算满意的成果,离我预期的效果还有些差距,但已经能感觉出来比3.5版本有了不少提升。 Agentic 根据官方介绍,Claude 3.7 Sonnet 在 TAU-bench 测试中取得了最先进的成绩,这是一个用于测试 AI 代理在复杂的真实世界任务中与用户和工具交互能力的框架。 为了验证Claude 3.7 的 Agent 功能,我们把上面这个静态页面变成一个可运行的动态应用,这是一个更为复杂的任务,完成它需要进好多个步骤。 我们试着只给 AI 一个目标,看它是否可以不需要在我干预的情况下完成这个复杂任务。 我们把Chat的模式选择成 “Agent” 并使用了如下的提示词进行输入 看来它给出了一个清晰的思路,那么我们就听它的,让它开始执行 由于需要使用到一些 npm 包,因此它主动输出了一系列命令去在本地安装这些依赖,我要做的只是点击接受。 当其中某一步配置出错时,它还会意识到问题并尝试另一种方式去执行,直接到成功为止,我要做的还是点击接受即可。 然后它就开始生成代码了,从左侧的目录中可以看到有大量文件被自动生成出来 在最后它为我生成了一个启动的指令,直接让服务启动了起来,这已经是一个动态的应用,但样式有些错乱(说明在执行过程中,它并未完美地保持原有静态文件的样式,可能我们应该在给它初始指令时把这一条需求给加进去) 又让它进行了一通修改后,已经好多了,不论如何它已经几乎是一个动态的应用了(后续我只要把 Mock 数据换成外部接口就行),更重要的是整个过程它是完全自己一步一步自动完成了,遇到错误也会自己重新切换思路尝试,这就是 Agent 的力量。 看了一下 Token 的使用量,整个过程大概使用了几十个 Cursor 的 Premium Models Fast Request, 大家觉得划不划算呢? …

Vacation in Bali

Vacation in Bali

缘起 2012 年,蜜月旅行我们第一次来到巴厘岛,第一次体验了这个四季开满鲜花的地方,即使当时刚进入社会囊中羞涩,但依然不影响这个小岛带给了我们的非常美好的回忆。 2016 年,在 PP 的邀请下,我们同学一行 10 余人再次来到了巴厘岛参加了 PP 的婚礼,也一起体验了乌布的稻田、阿贡火山、罗威纳的星空与海豚、库塔的海滩、金巴兰的海鲜烧烤,留下了另一段难忘的回忆。 2024 年的年中,我把孩子与夫人送到了卡加,我们的家庭开始了一段新的人生阶段,分隔两地我们都很期待年底的圣诞假期重逢的机会。 在口罩事件之前,我们几乎每年都会规划一次远行,但随着孩子的诞生和工作生活的忙碌,再加上口罩事件的发生,我们确实也好久没有一次投入身心的旅行了,所以我早早地就计划了这趟旅行,希望能让这面半球赤道边上的小岛的温暖能消融她们经历的北美冬天的寒意。 规划 虽然没太多长处,但不惧怕规划可能是我为数不多的特长之一,所以我在 8 月就开始规划了这趟旅行,提前买好了机票,并开始在 Booking 上预订了酒店,在 Indonesia 的移民局网站上提前办好了落地签,并开始规划了具体行程: 周六坐高铁去到上海,住在浦东机场边的酒店 周日一早飞去巴厘岛,傍晚入住乌布的 Alam Jiwa 酒店 周一在乌布旧地重游,去到我们走过的地方,再拍一张 8 年后的照片 周二乘车前往年轻人聚集的 Canggu,入住带私人泳池的 Komea Villa(顺便跨年) 周三到周五去往 Canggu 的海边与中心,体验一下 Beach Club 与当地美食 周五到周日,去往 Nusa Dua,入住 Grand Hyatt,享受酒店的私人沙滩与泳池 周日一早飞回中国,中转新加坡,再飞回杭州(省得飞到上海还要住宿停留) 主打一个 3个不同的区域,体验 稻田、Villa 与 沙滩 的三种截然不同的体验,事实证明这真是一个不错的安排 到达 女儿一回国就重新开始犯鼻炎和咳嗽,这次可以暂时离开冬天的杭州算是帮她缓解了症状。周六我们乘高铁来到上海,逛了逛古镇,吃了点小吃,便住在了浦东机场边上的酒店。 周日一早,我们便早早起来前往机场,经过 6 个小时的直飞,顺利地飞到了巴厘岛。由于我提前约好了车,所以一出机场就顺利地出发,于晚上 19:00 到达了乌布的 Alam Jiwa 酒店。 办理完入住,体验了酒店服务人员的热情,喝了非常可口的由新鲜水果制作的欢迎饮料,我们便出门寻找我提前预订好的一个叫 Mother 的餐厅,它离酒店不远,步行只要 3 分钟,在那里我们享用了到达后第一顿美食,人马上就放松了下来。 Alam Jiwa 的意思是自然之魂(Soul of Nature), 酒店位于乌布的郊区,周围是稻田与山林,酒店的装修风格是典型的巴厘岛风格,木质结构,大床,泳池,花园,身处其中,仿佛置身于自然之中。 乌布 Ubud 酒店提供的两顿早餐令人印象深刻,我们可以坐在面对稻田与椰子树的餐厅里,享受着巴厘岛的阳光与微风,品尝着当地的美食,人生中难得的惬意。 一早起来,吃完了难忘的早餐,一下楼小朋友就体会到了我们跟她说了好多次的关于这个开满鸡蛋花到处是郁郁葱葱的植物的花园一样的小岛,穿上泳衣她终于可以开始亲自体验了。 游完了泳,我们便开始了一天的行程,我们准备按计划去到我们 8 年前去过的地方,拍一张 8 年后的照片,带着孩子一起纪念我们曾经一同走过的青春。 我们先去到了之前捡到过大叶子的 Tjampuhan Old Bridge(铁桥已经因为年旧失修彻底变成了不让人使用的景点,好在我们又捡到了一张不小的叶子,8 年后我通过观察才知道这叶子原来是顶上榴莲树的叶子,女儿拿着把玩了半天); 然后我们步行去了乌布中心街道上的 White Orchid,吃了一顿当地特有的餐品(我猜应该要用手抓更加地道),然后去逛了乌布市场,吃了纯天然椰子冰淇淋,又喝了冰咖啡; 傍晚我们又去到了之前去过的脏鸭子餐厅,享受了一顿丰盛的晚餐,完美的一天。 第二天一早我们又在露台的阳光稻田微风中吃了一顿丰盛的早餐,然后便开始前往年轻人聚集的 Canggu,我们准备在那里的 Villa 里跨年。 苍古 Canggu 入乡随俗,我用 Gojek 叫了辆车送我们到...…

My 2024

My 2024

整体观感 2024 又是人生中变化巨大的一年,可能算是到目前为止变化最大的一年。 家庭顺利完成了移居阶段一的环节,一切都挺顺利,感谢上天感谢自己。 我切换到了新的工作岗位,倩切换到了新的时区新的工作生活节奏。 公司发展遇到了新的挑战, 我也开始把精力切换到新的能力构建阶段。 在巨大的变化中,仍然能保持稳步发展。 今年大事件 2 月回老家过年 陪倩完成小手术 换到了新部门新岗位 提前租好卡加房 提前采购家居用品 出国前给小语过生日 鹏鹏离开公司准备未来 小语上完国内最后一天学 整理行李送家人长登 回国整理家居切换生活 小语上学倩恢复工作 倩考出驾照买了辆车 哥本哈根及控制碳水(减重15斤) 开始坚持跑步形成惯性 前往北京出差 开始尝试AI+Dev,升级知识体系 出差台州推进难啃项目 母女回国老家圣诞与巴厘岛跨年 未来工作的进展 今年的体验 Xreal Pro 与倩西湖边徒步•斋菜•九漱 春天种了点菜 绣湖系列游戏 去晋江出差 和老兵钓鱼看电影户外 新 PC WOW,黑神话 新 Mac mini + Mac mini M4 和同学们短途出行及桃形李 和同学们一起鸬鸟山露营 看了 14 场电影 和家人一起巴厘岛跨年家庭旅行 写给未来 我们正处在一个变化的时代,我们的家庭也正处在转变的短暂几年之中 对于未来审慎乐观,对于窗口期要充分珍惜机遇 希望付出能有收获,希望人生顺利进入下个篇章 …

LUNIAO HIKING

LUNIAO HIKING

缘起 明显感觉到一年两次的徒步活动,大家能凑到一起的机会越来越少了。五一的那一次还因为我身在地球另一边而错过了,所以这一次希望总能成行。 路线 [2024年11月23日] 杭州出发: 杭州市区 ~ 驱车1小时 ~ 鸬鸟山脚 到达营地: 徒步半小时到达露营地 山顶徒步: 去不远的山顶简单徒步,来去几个山脊,深秋风景宜人 [2024年11月24日] 回杭: 鸬鸟山 ~ 1小时 ~ 杭州市区 到达 从杭州出发,接上刚从宁波过来的老大哥,约1小时来到鸬鸟山下的农家乐,吃个中饭就出发去到山脚,开始攀爬,其实只有不到 1500 级的台阶,毕竟所谓亲子路线,所以本次攀登相对轻松。 到了临近山顶的一个观景台,我们觉得这里相对风小,于是决定在此扎营。 山顶与山脊 展开帐篷后,天色还早,我们开始去往山顶,并延着山脊往前走了一段,有芦苇,有蓝天,有远处的山峦,令人心旷神怡。 夜幕降临,气温骤降,忍着寒冷开始没苦硬吃,不是,开始享受又一顿野外露天的晚餐。 这样的相聚总将愈来愈少,且行且珍惜。 …

The Build of mythbytes.com

The Build of mythbytes.com

过去2周,尝试了AI 融入开发,也简单分享了Learn With Helen 的尝试。 为了对 NextJS 有一个更深入的了解,这次我尝试开发了 MythBytes.com,一个基于 NextJS 的静态网站,并使用 Netlify 来托管。 第0步:初衷 当下看到的这个博客站,使用的是 Jekyll, 它是 Github Pages 的官方支持的静态站点生成器,使用的是 Ruby 语言。多年以来我一直使用它来发布博客,而我的发布流程一般都是先从 Gitbub 上拉取代码,在本地编写 Markdown 文章,为了更好的图片加载速度,我通常会把图片上传到阿里云的 OSS 上再把公链嵌入到文章中,然后我需要本地运行 Jekyll 测试效果,最后把文章推送到 Github 上,触发我提前配置好的与 Netlify 的自动集成,Netlify 会自动完成构建、部署, 新的内容就可以在互联网上被看见。 但是这样的过程显然不太方便,因为我的目标只是“编写一篇博客”,而我却要做很多额外的工作。于是我想着要不就借此熟悉 AI+Dev 的机会,尝试打造一个符合我心中诉求的博客站: 用户只需要负责编写与发布,不需要关心任何部署与维护的工作 我不希望使用任何第三方的服务,包括数据库、对象存储、CDN 等等 我希望充分使用 Netlify 的能力,简化建站流程(构建、部署、CDN、HTTPS、自动化) 第1步:模式选择 在实现这个目标之前,我需要先调研一下CMS系统一般的构建模式,它们基本上会被分类为以下几类 总结起来,Keystatic 的模式似乎更接近我的需求,所以我决定使用它的思路来从0打造一个自己的博客站,并且我不打算使用Github Apps,而使用原生 Github 的 API来进行集成。 第2步:技术选型 考虑到这是一次个人站的练习,我需要一个足够简单、灵活、易用的技术栈,我选择了 NextJS 作为框架,也希望借此机会熟悉一下 Node.js 生态下的的全栈开发模式。 同时,我还希望使用 Netlify 来托管我的站点,并使用 Netlify 的 CI/CD 能力来完成构建与部署。 考虑到我希望在未来用这个站分享更多并不关于个人,而是关于由好奇心驱动的探索内容,比如神秘主义与前沿科技,所以我根据这两个主要特性让 ChatGPT 帮我筛选了合适的域名,在众多选项中我选择了 MythBytes.com, MythBytes 在英文中是神秘字节的意思,听起来很酷,也符合我的预期。 第3步:构建成果 经过几天的构建与打磨,我借机熟悉了 NextJS 的开发模式,也更进一步了解了 Netlify 的能力与限制,最终于 Cursor 一起完成了 MythBytes 的开发。 分享代码如下:Github:G-CMS 第4步:总结 又一次与 AI 一起开发,我有了更多的感触,那就是它的价值不仅在于它能够完成多少工作,而在于它能帮助你快速理解一个领域,并在此基础上进行创新。这种赋能是以往任何工具都无法比拟的。 我相信它不仅加速了新产品的开发,也将改变开发者的学习方式与思维模式。 …

The Build of learn-with-helen.com

The Build of learn-with-helen.com

过去2周,尝试了AI 融入开发,另在此记录一下这次尝试中开发 Learn-with-helen.com 的过程,以作纪念 第0步:技术选型 “我需要开发一个前后端分离的 Web 应用,请推荐我使用目前比较流行的技术栈。选择合适的框架和开发模式,为我生成一个完整的工程架构,并告诉我每个目录的意图。” 这是我在一周前开始这个项目时,向 Cursor 提出的第一个需求。然后经过了无数的问答和几乎没有敲入一行完整代码的情况下,我和 Cursor 一起一步一步完成了这个项目。 拥有 AI 的帮助,我一个人完成了 UI 设计、前端开发、后端开发、数据库设计、CI/CD 部署,以及域名配置、HTTPS 配置等以往可能需要一个小团队或者至少是能自诩为”全栈”的开发者才能完成的工作。这就是 AI 的力量。下面来简单流水式地记录一下整个过程。 一开始,我先是有了一个想法,我的原则就是尽量使用我不是特别熟悉的技术栈,这样我可以尝试 AI 辅助开发的能力边界,同时也能借机熟悉这些技术栈: 在与 Cursor 的沟通中,我们得出了以下的技术选型: 前端使用 React (Npm) 后端使用 Spring Boot (Gradle) 数据库选择 PostgreSQL 使用 Nginx 作为反向代理 使用 Docker 作为容器,用 Docker Compose 来管理容器 把代码放在 Github 上,使用 Actions 来管理 CI/CD 流程 使用 AWS 的 EC2 服务器来部署 挂载域名,并使用 Let’s Encrypt 来开启 HTTPS 访问 第1步:框架搭建 完成最小可运行版本,它只需要满足几个最需要的需求: 前端:一个可以显示登录页面的页面(使用 React, Npm) 后端:一个可以提供登录的 API(使用 Spring Boot, Gradle) 数据库:一个可以存储用户信息的数据库(使用 PostgreSQL) 这个过程中,与 Cursor 一起主要完成了以下几个工作: 在本地安装 PostgreSQL,在 Cursor 帮助下解决了权限问题,并设计了用户信息的数据库,创建了用户表 基于 Spring Boot,结合 Cursor 提供的最佳实践,开发了登录 API(使用了 JWT 传递 token,最简单的版本) 要求 Cursor 设计了登录页面的 UI(初版非常简陋) 在 Cursor 辅助下配置 Node.js...…