稳定使用Claude 3.7 Sonnet的方法(不免费)

Claude官方网站是出了名的难注册+易封号,我之前好不容易注册的账号第二天就被封了,即使写了申诉邮件也没有任何回应,导致我从Claude 3发布到现在一直没能用上。

但办法总比困难多,最近我综合网上的一些教程,找到了可以稳定使用Claude 3.7 Sonnet等大模型API的方法。

首先去OpenRouter网站注册账号,申请API并充值,可以用国内的信用卡充值(但是需要架梯子才能打开OpenRouter网站)。注册、登录、充值、申请API Key之后,再去AI对话客户端中添加大模型。

关于AI对话客户端,个人比较推荐在电脑端用Cherry Studio,在手机端用Chatbox,但Chatbox其实不是很好用,特别是最近还偶尔会出现不明详情的网络错误,即使更新了几个版本这种问题仍然存在。期待Cherry Studio能尽快推出手机版。

接下来说说设置方法:

Cherry Studio
设置-模型服务-OpenRouter
启动OpenRouter服务
填上API Key
API地址(默认的,不用改):https://openrouter.ai/api/v1/
模型:拉到最底下,管理,找到“Anthropic: Claude 3.7 Sonnet”并添加

Chatbox
API模式:OpenAI API兼容
名称:随便填
API域名:https://openrouter.ai/api/v1
API路径:默认的,不用改
填上API Key
模型:anthropic/claude-3.7-sonnet

建议大家在使用时打开Cherry Studio或Chatbox的联网搜索功能,Claude 3.7 Sonnet的训练数据截止到2023年年底,不知道啥时候能更新一下,如果不打开联网搜索功能,给到的结果会比较陈旧。

价格方面,OpenRouter网站上有标示,Claude 3.7 Sonnet的API价格为:
$3/M input tokens、$15/M output tokens
的确比国内常见AI的API要贵很多。

关于Claude 3.7 Sonnet、Claude 3.7 Sonnet (thinking)、Claude 3.7 Sonnet (self-moderated)三个模型的区别,我也问了下Claude 3.7 Sonnet,答曰:需要直接答案选标准版,需要了解思维过程选thinking版,需要更保守、更安全的回答选self-moderated版。

OpenRouter提供了大量的国外大模型API,比如Gemma/Gemini、Grok、Llama、Phi、GPT、Cohere、Mistral、Perplexity等等,也有来自国内的Qwen和DeepSeek,实测Gemma、Gemini、Perplexity的API都可以直接使用,但Grok、GPT无法直接使用,如果不架梯子,会报错This service is not available in your region或unsupported_country_region_territory,其它的我还没试过,有兴趣的朋友们可以试试。

最初发布于2025年3月26日

打工人接入DeepSeek-R1 API不完全指南

这段时间DeepSeek爆火,工作中使用DeepSeek-R1的频率也越来越高,但DeepSeek官方的服务经常会出现服务器繁忙问题,基本无法正常使用,相信大家也经常遇到。解决办法有两个,一是使用已经接入了DeepSeek-R1的其它AI App,比如腾讯元宝、百度App、纳米AI搜索、Monica、Poe等等,二是使用云服务厂商或者硅基流动这种MaaS提供商都提供的DeepSeek-R1的API。这篇笔记结合这段时间的使用经历,给大家盘点一下哪家的客户端和API更好用。

说明一下,申请API,和在客户端中接入API都需要一点点动手能力,如果懒得搞,可以用去用上文提到的那些App。但对于工作场景来说,我还是更推荐去申请、接入API,更利于专注工作,不被各家厂商各种形式的广告或引流手段干扰。而且这不仅仅是DeepSeek官方服务不稳定时的一个过渡手段,更能给后续使用其它API积累一些经验。

1、怎样申请API

去DeepSeek开放平台、硅基流动或火山引擎官网注册账号、实名认证、选择模型、获取并复制API Key,不同平台在操作上略有区别。

2、用哪个客户端接入API

这里我主要推荐两款App,Chatbox和Cherry Studio,需要注意的是这段时间两款App更新非常频繁,如下内容仅说明了我在写这篇笔记时使用的版本功能。

Chatbox(Mac端版本号1.10.4,安卓端版本号1.9.8)

优势:

电脑端和手机端都有App;

接入API非常简单,预置了一些常用的AI服务,只需填写API Key就能使用;

预置了一些“搭档”可以添加使用,可以分别调用不同的模型;

支持联网搜索,会给出所有的参考链接,并且免费,点亮工具栏的地球就可以了。

不足:

不同模型的切换略显复杂;

思考过程的展现和对话内容的输出会卡顿,一段一段的蹦出来,不够流畅;

界面设计较为粗糙,或者说复古;

对话记录和模型设置无法做到多端同步(没有账号系统,希望后续能够上线)。

Cherry Studio(Mac端版本号1.0.4,安卓端无)

优势:

接入API非常简单,预置了比Chatbox更多的常用的AI服务,特别是大量国内的大模型,只需填写API Key就能使用;

支持自行设置助手,分别调用不同的模型;

预置了一些“智能体”可以添加使用,可以分别调用不同的模型;

不同模型的切换非常简单;

思考过程的展现和对话内容的输出都非常流畅;

以小程序(或者说网页)的形式提供了40余个大模型,点击并登录就能使用;

界面美观,设计比较现代;

支持翻译、生成图片等等办公中常用的功能;

最新版本可通过申请tavily的API实现全部模型联网搜索,会给出所有的参考链接,每月可以免费使用1000次,解决了下文会说到的部分API无法联网获取最新信息的问题,默认会提供5个搜索结果,可调整至最多20个,并且可以设置搜索结果黑名单,屏蔽来自部分网站的搜索结果。

不足:

暂无手机端App,仅有电脑端App;

对话记录和模型设置无法做到多端同步(没有账号系统,希望后续能够上线);

支持知识库功能的模型非常有限,我接入了DeepSeek官方、硅基流动、火山方舟三家的多个模型,其中仅有硅基流动提供的BAAI/bge-m3向量模型支持知识库。

3、哪家的API好用?

DeepSeek官方提供的API:

服务不稳定,经常遇到因繁忙不响应的情况,且API本身不支持联网搜索最新信息,时不时的就用英文回答我,像极了GPT-4刚上线那段时间。

硅基流动提供的API:

服务稳定性居中,偶尔会不响应,或者响应速度比较慢,且API本身不支持联网搜索最新信息,也会时不时的就用英文回答我。

不知道大家有没有遇到这个问题,硅基流动的API貌似需要先充值(充几块钱就行)才能使用,如果不充值会提示连接失败,充值之后立刻就能正常使用。

火山引擎提供的API:

服务稳定,响应速度快,在我使用的这段时间基本没有遇到不响应的情况,且API本身就已支持联网搜索最新信息(唯一的不足是看不到具体参考了哪些链接)。

综上,目前看来最稳定、功能最完整的API,是火山方舟提供的deepseek-r1 。

3、哪家的API更便宜?

DeepSeek官方API价格(deepseek-reasoner):

百万tokens输入(缓存命中)1元,百万tokens输入(缓存未命中)4元,百万tokens输出16元。

硅基流动API价格(Pro/deepseek-ai/DeepSeek-R1):

百万tokens输入4元,百万tokens输出16元,目前赠送14元。

火山引擎API价格(deepseek-r1):

百万tokens输入4元,百万tokens输出16元,目前赠送50万tokens免费额度。

综上,个人比较推荐的两个组合是:

电脑端:Cherry Studio+火山引擎/硅基流动的DeepSeek API

手机端:腾讯元宝/Chatbox+火山引擎的DeepSeek API

大家还有哪些用起来很顺手的组合?欢迎讨论。

最初发布于2025年3月5日

Mac常用App推荐:Notion及Notion AI

之所以要推荐Notion,要从ChatGPT的火爆说起。在ChatGPT大火之后,国内外一众互联网公司都快速推出了类似的大模型产品,比如百度的文心一言、阿里的通义千问等等。不过经过我和同事们的实际测试,在我们的日常工作场景下,还是ChatGPT能力最强。美中不足的是ChatGPT无论是注册、付费开通Plus还是日常使用都很复杂,给使用增添了一些难度。

对于经常需要写作的打工人来说,内嵌在笔记工具中的AI,可能会比网页版的ChatGPT更加实用,比如我今天要说的Notion,和它集成的Notion AI。

同步、记录、收藏、分享、协作

先来说说Notion作为一款笔记App的基本功能。Notion可以在多设备间自动同步笔记内容(不像熊掌记,要先订阅才能自动同步,且Notion的同步不依赖iCloud),已经覆盖了Android、iOS、Windows、macOS四大平台,用起来很方便。而且也可以直接在Notion.so网页里使用,界面、操作方式都和App高度一致。

Notion在记录方面的功能很丰富,可以在页面中添加页面、文本、表格、代码、图像、视频、音频、文件等等等等。而且Notion内置了一些模板,比如项目管理、任务、日记、读书清单等,一个App就能搞定多种需求。

Notion貌似没有按文件夹给笔记分类的功能,只能页面里再套页面。与之相比,苹果备忘录可以文件夹里套文件夹,也可以用“智能文件夹”按标签分类,这两种分类方式更符合我的使用习惯。像熊掌记那种纯按标签分类的方式实在是用不惯,在用了一段时间后我就把笔记都转到苹果备忘录了。

然后说说收藏功能,Safari和Chrome(以及Edge)可以安装Notion Web Clipper插件,收藏的网址默认会自动归类到My links中,部分链接可以自动获取网页正文。如果是在手机浏览器上看到喜欢的内容想要收藏的话,可以选择分享——更多——Notion,效果和Notion Web Clipper是一样的。这里也对比一下熊掌记,安装熊掌记App后会自动给Safari安装扩展,点击就能直接保存到熊掌记,图文、链接全都会保存到笔记中。

关于分享和协作,点击笔记右上方的Share可以创建分享链接,分享给他人,并设置是否允许修改、评论、复制等权限。即使没有安装Notion,分享链接的内容也可以在网页里查看。如果想要保存下来,可以点击Duplicate复制到自己的Notion里。

想要更丰富的团队协作功能,需要升级Plus Plan及以上的订阅计划,就可以创建群组并且邀请成员加入,订阅计划有点复杂,下文会详谈。

重点说说Notion AI

Notion开发团队在原本的笔记功能基础上,深度集成了AI能力,也就是Notion AI。貌似Notion AI的AI能力来自于GPT-3.5。使用Notion AI无需搭梯子,点开就能直接用,而且速度非常快。

先来说一下Notion AI的使用方法,首先你可以用Notion AI进行从零到一的内容创作。新建空白页面后,点击“Start writing with AI”,或者在标题下方按空格,就可以开始Draft with AI。它可生成多种体裁的内容,比如脑暴创意、博客文章、社交媒体文案、论文、待办事项、营销邮件、工作描述等等,甚至还能写诗?

其次,你可以用Notion AI帮你修改内容,比如在自己写完一段内容之后,可以选中它并用AI续写、改正拼写和语法错误、对上文作总结、扩写、缩写、改变语言风格,在多种语言之间翻译,等等。

第三,可以让Notion AI帮你搜集资料,新建页面后直接输入问题并回车即可,比如你可以用它快速了解一部小说讲述了怎样的故事。

建议大家多多尝试各种prompt,发掘Notion AI的能力。虽然它生成的内容大概率无法直接使用,但可以给到新思路、新灵感,或者帮忙提炼要点、翻译等等,帮你跳过初稿阶段,提高一点点内容的生产效率。

据另一个深度使用Notion AI的同事说,用Notion AI写稿子会从现有的笔记中摘取信息。相当于你自己建立了一个知识库,这个知识库就会成为Notion AI的写作素材。

最近Notion AI更新了一个Q&A功能,目前还处在Beta阶段,在任何一个页面右下角点击星号就能使用。Q&A功能可以Notion工作空间中的现有笔记中查找和提取信息来回答问题,但无法从网络或者任何其它外部源获取信息。

Notion AI美中不足的地方也盘点一下。首先,在新页面中问完第一个问题,或者说让它写完第一段内容之后,后面的内容都会受前面内容的影响。如果问另一个问题,有时会这样提示:很抱歉,我无法回答你的问题,因为它与文档内容无关。请提供与文档相关的指示,我将尽力提供帮助。

其次,如果问了一个问题,Notion AI在给出答案之后就看不到问题了,只剩答案,毕竟Notion AI不是问答型的AI。

第三,在记录的过程中只要一断行,就会出现Press ’space’ for AI, ‘/’ for commands…的灰色文字提示,想要专心记录的时候,这种提示会有一点点分心。

多到略显复杂的订阅计划

Notion的电脑端目前有Free Plan、Plus Plan、Business Plan、Enterprise Plan四个订阅计划,第一个免费,基本功能没有什么限制,主要是限制了历史记录时间和可邀请的游客数量。如果需要更长时间的历史记录、更多的文件上传空间和更多的游客/协作成员数量,可以选择后三种订阅计划,订阅价格分别是每月10美元、18美元、25美元。

Notion的苹果手机端还有一个名为Personal Pro的订阅计划,权益比在网页中订阅Plus Plan还要更多一些,订阅价格是人民币每月35元,每年323元,相比之下,在手机端订阅性价比稍微高一点(但还是挺贵的我觉得)。

还没有完,Notion AI是需要单独订阅的,免费试用20次(20轮对话)之后就需要付费,费用方面,按年订阅每月8美元,按月订阅每月10美元,而且貌似只能在电脑上订阅,苹果手机端没有找到单独订阅Notion AI的入口。实测使用招行VISA卡就可以订阅,比订阅ChatGPT要简单太多了。

这么多种订阅计划着实有些复杂。简单说,如果对协作者数量和历史记录时间没有太大需求的话,用免费版再加上Notion AI,就已经足够了。其他功能可以在使用过程中看看会不会用到,再决定是否订阅。

总结

Notion本身是一款不错的笔记App,在有了Notion AI加持后,能力更加全面。建议大家先拿网页版试一试,如果感觉确实比较符合自己的需求,再考虑是否订阅。

当然Notion也有一点点体验不太好的地方,比如Notion界面全英文,再比如导入功能不支持直接导入苹果备忘录。我有近千条的笔记都在苹果备忘录里,要转移阵地还是有点费劲。

如果你更习惯于只用图片+文字来记笔记的话,可能苹果备忘录或者熊掌记会更适合你。Notion界面看似简洁,但它大而全,内嵌了非常多的功能,难免会让人感觉有些臃肿。

而且如果网络不是很稳定的话,分享链接打开的速度会很慢,甚至Notion App偶尔还会掉线,影响使用。

最后,对于笔记类工具App,我一直以来都认为笔记内容本身才是最重要的,找到一款适合自己的笔记App后就不要频繁更换。而且笔记内容分散在多个App里,实际用起来也会比较麻烦。

不定期更新App推荐及使用心得,欢迎关注。

最初发布于2023年12月6日

华为发布面向2025十大趋势 VR/AR/AI等技术融合应用将带来超级视野

​5G、云、IoT、AI的融合应用正在塑造一个万物感知、万物互联、万物智能的世界,它比我们想象中更快地到来。

华为在近日发布《全球产业展望GIV@2025》,提出智能世界正在加速而来,触手可及,并预测:到2025年,智能技术将渗透到每个人、每个家庭、每个组织,全球58%的人口将能享有5G网络,14%的家庭拥有“机器人管家”,97%的大企业采用AI。

《全球产业展望GIV@2025》于2018年首次推出,初衷是打开智能世界的产业版图,为各行各业创新增长提供路径参考。

2019年,华为基于对交通、零售、金融、制造、航空等17个重点行业的案例研究,并结合定量数据预测,进一步提出了面向2025的十大趋势,呈现了一个触手可及的智能世界。

这十大趋势分别是:

趋势一:是机器,更是家人

随着材料科学、感知人工智能以及5G、云等网络技术的不断进步,将出现护理机器人、仿生机器人、社交机器人、管家机器人等形态丰富的机器人,涌现在家政、教育、健康服务业,带给人类新的生活方式。

《全球产业展望GIV@2025》预测:2025年,全球14%的家庭将拥有自己的机器人管家。

趋势二:超级视野

以5G、AR/VR、机器学习等新技术使能的超级视野,将帮助我们突破空间、表象、时间的局限,见所未见,赋予人类新的能力。

《全球产业展望GIV@2025》预测:2025年,全球的VR/AR用户数将达3.37亿,采用VR/AR技术的企业将增长到10%。

到2025年,全球5G网络覆盖率将达到58%。届时,5G、4K+、VR、AR和AI技术的融合应用不仅能为人们带来全新的体验“超级视野”,它让人们能够以前所未有的方式看待事物,提高各个垂直行业的生产力。“超级视野”能跨越距离、表象和时间,为个人、企业和社会带来巨大利益。

突破距离

电力:目前,天然气资源占世界能源资源总量的22%,需求量每年增长1.6%。天然气一般由陆地管道输送,绵延数千公里,往往要穿越人烟稀少的偏远地区或恶劣复杂的地形,难免出现管道破损,造成天然气泄漏。在美国,年均管道事故近90次,导致1000万个家庭燃气供应不足。

管道上的一处破裂,往往需要有经验的工程师奔波几周甚至上月才能找到,而维修施工缺陷又进一步降低了管道维修的效率。维修施工缺陷是造成燃气管道事故的第三大原因。

然而,“超级视野”让这一切都发生了变化。到2025年,搭载着5G传输器和4K摄像头的管道巡检机器人将代替工程师监控和检查管道。工程师坐在控制室里就能看到管道周围的环境,随意调转视角看清管道损坏的细节原因,进而给出判断,指挥管道机器人进行维修。据预测:到2025年,全球电站设备巡检机器人数量将达到4200台,市场价值超过4.9亿美元,高于2017年的7600万美元。

污水处理系统:污水管道的直径最小为6英寸(150毫米),而污水管道外用混凝土衬砌的隧道直径长达30英尺(9米)。

因此,低压污水处理系统更倾向于在每个连接点使用小型研磨泵。这样的设计导致人工难以检查细小管道是否存在腐蚀、变形和堵塞。但坚固、防水和防尘的机器人巡检车可以突破人类的极限,监控故障并进行小型检修。具有强大计算能力的全自动无绳机器人可以搭载存储器模块,存储视频和图像,传输管道裂缝的高分辨率图像,并检测两个检修孔之间的故障位置和方向,完成人类无法完成的任务。

突破表象

医疗:据世界卫生组织估计,全球约有430万的医护人员缺口,到2030年这一缺口将增加到900万[6]。而5G、VR、AR技术的出现与应用,为全球医疗界带来了“超级视野”,让医疗资源跨越地理和经济差距,让每个人享受到更多、更平等的医疗服务。

眼疾诊断:视力障碍是一个严重的全球性问题。全球大约有13亿人患有近视力或远视力障碍,轻微远视力障碍患者达1.885亿人,中度和重度视力障碍患者达2.17亿人,另有3600万盲人。此外,随着年龄的增长,人眼中的天然晶状体会变得混浊老化,白内障等眼部疾病的发病率也会随之增加,最终影响视力。

在发病前,人类医生很难注意到人眼逐渐发生的变化。人工智能诊断工具可以帮助人们预防可能发生的眼疾并得到及时治疗,防止病情恶化。目前,人工智能机器人能够诊断50多种疾病,诊断精准度堪比人类医生。一项测试表明,相比八名医生会诊,这套人工智能软件能在94%的场合给出相同的诊断结果。为了避免误诊,人工智能机器人采用了一组算法,而非单一算法,因此任何一种算法的错误都会被其他算法推翻。根据诊断概率,该系统会对每个诊断结果的可能性进行评估和评分,并予以注解。

突破模糊

随着数字成像智能化水平的不断提高,扭曲或碎片化的图像能够被转化为清晰的大师级作品。它的工作原理究竟是怎样的呢?人工智能成像技术可以还原被雨水浸湿或沾有污渍的图像、重像素化或低分辨率图像以及被某个元素遮盖的图像。除了图像,这项技术也可用于还原视频。

该技术不仅仅只是先进的图片编辑工具,还能催生可以像人一样分析周边环境的人工智能机器。例如,数字成像技术可以帮助自动驾驶车辆在路况较差和恶劣天气条件下行驶,极大地提高驾驶安全性。

突破时间

建筑和艺术承载了丰富的历史文化。保存、欣赏和传承这些历史文化,是人类发展的共同愿望。

然而,目前我们保护历史文物的技术还不能帮助我们保护人类文明。据国际失踪艺术品记录组织(ALR)统计,全球每年失窃和丢失的文物高达1.2万件。2018年,巴西国家博物馆因为一场大火酿造了人类的悲剧——馆藏2000多万件文物的90%被燃为灰烬。2019年4月,巴黎圣母院失火,损毁严重,其标志性塔尖倒塌。

时间也是建筑和艺术的敌人。虽然罗马斗兽场和雅典帕特农神庙依然庄严屹立、耐人回味,但它们俨然已不是建成之初的模样。

“超级视野”已经成为挽回人类文明记忆的福音,可以让已经消失的历史古迹重现眼前。阿富汗1500年前建成的巴米扬大佛高53米,但在2001年被炸毁。技术人员利用AR技术和先进的3D激光投影仪(光通量为600,000流明,相当于30台电影放映机)使大佛得以1∶1实景重现。这项壮举不仅仅是技术上的成功,而且精准还原了几个世纪以前创造的文化遗产。

在欧洲,VR博物馆可以让更多人领略艺术的魅力。荷兰艺术收藏家乔治·克拉默(George Kremer)曾考虑在一家实体博物馆展出他收藏的74幅来自17世纪荷兰和佛兰德大师的画作,但苦于一直找不到合适的场馆,即便是世界上最好的博物馆,每年也只能接待900万到1000万游客。

趋势三:零搜索

受益于人工智能及物联网技术,智能世界将简化搜索行为和搜索按钮,带给人类更为便捷的生活体验:从过去的你找信息,到信息主动找到你;未来,不需要通过点击按钮来表达你的需求,桌椅、家电、汽车将与你对话。

《全球产业展望GIV@2025》预测:2025年,智能个人终端助理将覆盖90%的人口。

趋势四:懂“我”道路

智能交通系统将把行人、驾驶员、车辆和道路连接到统一的动态网络中,并能更有效地规划道路资源,缩短应急响应时间,让零拥堵的交通、虚拟应急车道的规划成为可能。

《全球产业展望GIV@2025》预测:2025年,C-V2X(Cellular Vehicle-to-Everything)蜂窝车联网技术将嵌入到全球15%的车辆。

趋势五:机器从事三高

自动化和机器人,特别是人工智能机器人,正在改变我们的生活和工作方式,他们可以从事处理高危险、高重复性和高精度的工作,无需休息,也不会犯错,将极大提高生产力和安全性。如今,智能自动化在建筑业、制造业、医疗健康等领域中广泛应用。

《全球产业展望GIV@2025》预测:2025年,每万名制造业员工将与103个机器人共同工作。

趋势六:人机协创

以人工智能、云计算等技术的融合应用,将大幅度促进未来创新型社会的发展:试错型创新的成本得以降低;原创、求真的职业精神得以保障;人类的作品也因机器辅助得以丰富。

《全球产业展望GIV@2025》预测:2025年,97%的大企业将采用AI。

趋势七:无摩擦沟通

随着人工智能、大数据分析的应用与发展,企业与客户的沟通、跨语种的沟通都将可能变得无摩擦,因为精准的信息到达,人与人之间更容易理解、信任彼此。

《全球产业展望GIV@2025》预测:2025年,企业的数据利用率将达86%。

趋势八:共生经济

无论身在何处、语言是否相通、文化是否相似,数字技术与智能能力逐渐以平台模式被世界各行各业广泛应用。各国企业都有机会在开放合作中,共享全球生态资源,共创高价值的智能商业模式。

《全球产业展望GIV@2025》预测:2025年,全球所有企业都将使用云技术,而基于云技术的应用使用率将达到85%。

趋势九:5G,加速而来

大带宽、低时延、广联接的需求正在驱动5G的加速商用,将渗透到各行各业,并比我们想象中更快地到来。

《全球产业展望GIV@2025》预测:2025年,全球将部署650万5G基站,服务于28亿用户,58%的人口将享有5G服务。

趋势十:全球数字治理

触及智能世界,遇到了新的阻力和挑战。华为呼吁全球应该加快建立统一的数据标准、数据使用原则;并鼓励推动建设第三方数据监管机构,让隐私、安全与道德的遵从,有法可依。

《全球产业展望GIV@2025》预测:2025年,全球年存储数据量将高达180ZB。

以上内容摘自华为《全球产业展望GIV@2025》。

最初发布于2019年8月8日

阿里巴巴与英特尔联手开发AI驱动的3D运动员跟踪技术

在CES展会上,阿里巴巴集团与英特尔共同宣布,将开发首个由人工智能驱动的3D运动追踪系统,计划应用于2020东京奥运会及之后的奥运会上。

该技术由英特尔开发,名为3D运动员跟踪(3D Athletes Tracking)技术,经优化能够在阿里云的基础架构上运行。

基于阿里巴巴的云计算能力及英特尔的硬件配套及深度学习算法,这套3D运动员追踪技术可以通过一般的摄录机,而不需要用专门的感应器,即可以创建出3D网格(3D mesh),让教练及培训员可以分析由运动员动作产生的错综复杂且即时的生物力学数据。

具体来说,该技术充分利用先进的姿态建模技术和其他人工智能算法,旨在对运动员的动作进行生物力学分析。运动员的表现由常规摄像机捕捉后,利用人工智能算法进行大量运算,并生成一个运动表现数字模型,该模型可以通过多种方法进行分析。

通过人工智能及高准确度的模型,教练员和培训员可以从中提取复杂的实时生物力学数据,对运动员的表现进行分析,并引入新的训练强化手段,为运动员改善动作及提升表现。

除了为运动员带来好处之外,这项技术也将提升观众的体验,让他们更深入了解世界级运动员的表现,比如在2020年东京奥运会上,直播机构将可使用该系统分析、剪接及查看精彩片段,并即时为观众提供精彩画面回放。

奥运项目是英特尔与阿里巴巴最新开展的一项合作。不久前,阿里巴巴部署了英特尔的最新处理器和内存技术,用以支持“双十一”全球购物狂欢节。

最初发布于2019年1月11日