1、在GitHub创建了AINOTE仓库,询问AI后发现需要使用终端命令、生成密钥、克隆仓库到本地等操作,以后再试
2、测试使用Cursor修改由Trae创建的项目,在Cursor中打开test_2,测试如下需求:
检查一下这个App有没有可以优化的地方
3、Cursor给出一些“优化和提升用户体验、代码质量的建议”,比如考虑支持快捷键、加载状态提示、细化错误提示、过滤输入内容、提升可维护性、支持长按复制消息内容等
4、进一步明确需求:
1.我需要给这个App增加对回车发送消息的支持
2.允许用户开启新对话,并随时返回查看过往的对话列表
3.支持长按消息复制、删除或收藏
4.增加一个集中管理收藏内容的地方,可以放在对话列表的最前面
5.细化错误提示
6.应用你建议中第4条里的1和3对代码可维护性进行优化
Cursor会对需求进行分解并列出详细的开发任务,可以选择优先实现某一项,也可以按顺序逐步进行,按顺序进行的话,每完成一项需要确认继续下一项
7、上述步骤完成后,提出“结合最新的应用特性,优化一下README”文件,Cursor对README进行了优化
8、之后由Cursor检查是否存在问题,在修正问题之后提示构建成功,之后在Xcode中测试,模拟器测试可以打开,但界面存在一些交互逻辑上的问题,后续再行调整
标签: AI
DevLog:2025年7月7日
1、开始测试Cursor,虽然是全英文界面,但在对话时完全可以直接使用中文,内置了一些模型,也可以自行添加兼容OpenAI的模型,创建文件夹test_c
2、提出需求“创建一个名为AINOTE的备忘录应用,内置富文本编辑器和AI对话功能,AI对话功能可使用兼容OpenAI的自定义大模型,可以将AI生成的内容收藏到备忘录中,该应用支持iOS设备”,Cursor会提示进一步明确、补充需求细项,让需求更具体,并且给出建议的技术栈、数据存储和同步方案等,之后给出项目结构、主要功能模块、关键技术点和开发计划,下一步即将生成项目初始化代码和主要模块的SwiftUI代码骨架
3、确认之后开始编写:按以下结构组织项目、创建主要的应用文件结构、创建数据模型、创建服务层、创建视图模型、创建主要的视图文件、创建备忘录列表视图、创建备忘录编辑视图、创建AI对话视图、创建设置视图、创建资源文件、创建README文件,之后开始修复代码中的问题、创建启动脚本帮助用户快速开始,chmod +x setup.sh 赋予可执行权限,之后便提示创建完成,到目前大概二十多分钟时间,并且支持iOS 17及以上
4、使用Xcode打开该项目时会提示
The project ‘AINOTE’ is damaged and cannot be opened. Examine the project file for invalid edits or unresolved source control conflicts.
Path: /Users/jinlei.wu/Desktop/test_c/AINOTE.xcodeproj
Exception: -[PBXGroup buildPhase]: unrecognized selector sent to instance 0x600003245ad0
Cursor猜测项目文件有问题,确认之后Cursor开始重新创建项目文件,配置Swift文件引用关系,之后提示可以正常使用
5、再次使用Xcode打开,Xcode提示存在3个小问题,但已经可以正常运行,且界面精致程度(再次吐槽Trae写的App竟然不会全屏)、功能丰富程度(仅对比AI对话界面)要优于Trae编的App
6、Xcode提示的三个小问题,交给Cursor修复:
Xcode提示这三个小问题,帮我修复一下
Desktop/test_c/AINOTE/Models/Note.swift:5:9 Immutable property will not be decoded because it is declared with an initial value which cannot be overwritten
Desktop/test_c/AINOTE/Models/AIMessage.swift:4:9 Immutable property will not be decoded because it is declared with an initial value which cannot be overwritten
Desktop/test_c/AINOTE/Views/AIChatView.swift:60:26 ‘onChange(of:perform:)’ was deprecated in iOS 17.0: Use ‘onChange’ with a two or zero parameter action closure instead.
Cursor会快速修复并验证,提示成功,代码符合最新的Swift和iOS开发标准
7、再次使用Xcode打开,已经没有任何错误提示,就目前这种简单的应用编写和测试结果来看,Cursor的确要比Trae更胜一筹,Cursor会进一步明确需求、快速修复问题,且修复成功率更高,不清楚是否是因为我在Trae中主要使用的是Claude Sonnet 4,后续再对比测试
DevLog:2025年7月4日
1、得知在开发和测试阶段完全不需要交688
2、继续让Trae解决前一天的问题,猜测可能需求有些复杂了,于是简化需求:简化一下这个App,只允许用户添加一个大模型的API,无需添加多个模型并在不同模型间切换
3、Trae快速对前一天的代码和文件进行删减,并进行构建,提示构建成功,放到Xcode中会提示Build Failed,再次在Trae测试后仍然提示构建成功,已经解决了之前的构建错误
4、于是用Xcode打开当前项目,提示构建失败,但看了下错误提示,是缺少了两个文件夹,在项目文件夹的指定位置创建文件夹后再试,构建成功!模拟器启动,已经可以打开App、打开设置界面了,但未测试能否添加模型、能否与AI对话
5、发现这个App在模拟器上不能全屏运行,界面上面和下面都有大黑边,复制一份项目文件夹(命名test_2),让Trae尝试修正不能全屏的问题,Trae经过调整后表示已经修正,且构建成功
6、使用Xcode打开之后,提示构建成功,但还是不能全屏,继续让Trae修正,Trae修正后构建成功,再次打开Xcode打开test_2,已经可以全屏显示,并且避开了顶部的灵动岛,但输入框和发送按钮太靠近底部边缘,继续让Trae修正,添加了底部边距之后界面基本OK了,不是很理解,明明Trae在编写App时iOS系统版本是18.5以上,为什么还会有这种应用不全屏的问题
7、另外使用Xcode打开时还出现了如下错误提示:
/Users/jinlei.wu/Desktop/test/ChatApp/ChatView.swift:38:22 ‘onChange(of:perform:)’ was deprecated in iOS 17.0: Use ‘onChange’ with a two or zero parameter action closure instead.
询问豆包后得知,这是 Xcode 针对 iOS 17 及以上版本的 SwiftUI 代码给出的警告,表明Trae使用的onChange(of:perform:)方法已经被弃用,需要改用新的语法,参考豆包的答复稍作修改,错误提示消失
8、注册并下载了另一个AI编程工具Cursor,以后再试,先继续用Trae调整test_2
DevLog:2025年7月3日
1、首次测试AI编程工具Trae,接入了OpenRouter平台的Claude Sonnet 4
2、在Trae中输入应用需求后,创建项目文件夹(命名test),AI快速编写了iOS App,但我并没有进行构建测试,也不清楚是否有问题,需求:生成一个使用SwiftUI编写的对话App,可以通过该App与OpenAI兼容格式的大模型对话
3、进一步丰富了应用需求:继续完善这个App,需要允许用户添加多个大模型,并且在聊天过程中可以随时切换大模型
4、但Trae貌似陷入了死循环,不停地出现构建失败、检查问题、修复问题、再构建失败的情况,将模型切换成DeepSeek-R1之后不能直接帮我修改问题,只会分析问题可能出现在哪儿
5、用Xcode打开当前项目,提示构建失败,没注意看错误提示是啥
6、使用Trae的过程中多次收到提示“模型思考次数已达上限,请输入“继续”后获得更多结果”,且多次出现文件被截断的问题
7、注册了Apple开发者账号并且交了688
稳定使用Claude 3.7 Sonnet的方法(不免费)
Claude官方网站是出了名的难注册+易封号,我之前好不容易注册的账号第二天就被封了,即使写了申诉邮件也没有任何回应,导致我从Claude 3发布到现在一直没能用上。
但办法总比困难多,最近我综合网上的一些教程,找到了可以稳定使用Claude 3.7 Sonnet等大模型API的方法。
首先去OpenRouter网站注册账号,申请API并充值,可以用国内的信用卡充值(但是需要架梯子才能打开OpenRouter网站)。注册、登录、充值、申请API Key之后,再去AI对话客户端中添加大模型。
关于AI对话客户端,个人比较推荐在电脑端用Cherry Studio,在手机端用Chatbox,但Chatbox其实不是很好用,特别是最近还偶尔会出现不明详情的网络错误,即使更新了几个版本这种问题仍然存在。期待Cherry Studio能尽快推出手机版。
接下来说说设置方法:
Cherry Studio
设置-模型服务-OpenRouter
启动OpenRouter服务
填上API Key
API地址(默认的,不用改):https://openrouter.ai/api/v1/
模型:拉到最底下,管理,找到“Anthropic: Claude 3.7 Sonnet”并添加
Chatbox
API模式:OpenAI API兼容
名称:随便填
API域名:https://openrouter.ai/api/v1
API路径:默认的,不用改
填上API Key
模型:anthropic/claude-3.7-sonnet
建议大家在使用时打开Cherry Studio或Chatbox的联网搜索功能,Claude 3.7 Sonnet的训练数据截止到2023年年底,不知道啥时候能更新一下,如果不打开联网搜索功能,给到的结果会比较陈旧。
价格方面,OpenRouter网站上有标示,Claude 3.7 Sonnet的API价格为:
$3/M input tokens、$15/M output tokens
的确比国内常见AI的API要贵很多。
关于Claude 3.7 Sonnet、Claude 3.7 Sonnet (thinking)、Claude 3.7 Sonnet (self-moderated)三个模型的区别,我也问了下Claude 3.7 Sonnet,答曰:需要直接答案选标准版,需要了解思维过程选thinking版,需要更保守、更安全的回答选self-moderated版。
OpenRouter提供了大量的国外大模型API,比如Gemma/Gemini、Grok、Llama、Phi、GPT、Cohere、Mistral、Perplexity等等,也有来自国内的Qwen和DeepSeek,实测Gemma、Gemini、Perplexity的API都可以直接使用,但Grok、GPT无法直接使用,如果不架梯子,会报错This service is not available in your region或unsupported_country_region_territory,其它的我还没试过,有兴趣的朋友们可以试试。
最初发布于2025年3月26日
打工人接入DeepSeek-R1 API不完全指南
这段时间DeepSeek爆火,工作中使用DeepSeek-R1的频率也越来越高,但DeepSeek官方的服务经常会出现服务器繁忙问题,基本无法正常使用,相信大家也经常遇到。解决办法有两个,一是使用已经接入了DeepSeek-R1的其它AI App,比如腾讯元宝、百度App、纳米AI搜索、Monica、Poe等等,二是使用云服务厂商或者硅基流动这种MaaS提供商都提供的DeepSeek-R1的API。这篇笔记结合这段时间的使用经历,给大家盘点一下哪家的客户端和API更好用。
说明一下,申请API,和在客户端中接入API都需要一点点动手能力,如果懒得搞,可以用去用上文提到的那些App。但对于工作场景来说,我还是更推荐去申请、接入API,更利于专注工作,不被各家厂商各种形式的广告或引流手段干扰。而且这不仅仅是DeepSeek官方服务不稳定时的一个过渡手段,更能给后续使用其它API积累一些经验。
1、怎样申请API
去DeepSeek开放平台、硅基流动或火山引擎官网注册账号、实名认证、选择模型、获取并复制API Key,不同平台在操作上略有区别。
2、用哪个客户端接入API
这里我主要推荐两款App,Chatbox和Cherry Studio,需要注意的是这段时间两款App更新非常频繁,如下内容仅说明了我在写这篇笔记时使用的版本功能。
Chatbox(Mac端版本号1.10.4,安卓端版本号1.9.8)
优势:
电脑端和手机端都有App;
接入API非常简单,预置了一些常用的AI服务,只需填写API Key就能使用;
预置了一些“搭档”可以添加使用,可以分别调用不同的模型;
支持联网搜索,会给出所有的参考链接,并且免费,点亮工具栏的地球就可以了。
不足:
不同模型的切换略显复杂;
思考过程的展现和对话内容的输出会卡顿,一段一段的蹦出来,不够流畅;
界面设计较为粗糙,或者说复古;
对话记录和模型设置无法做到多端同步(没有账号系统,希望后续能够上线)。
Cherry Studio(Mac端版本号1.0.4,安卓端无)
优势:
接入API非常简单,预置了比Chatbox更多的常用的AI服务,特别是大量国内的大模型,只需填写API Key就能使用;
支持自行设置助手,分别调用不同的模型;
预置了一些“智能体”可以添加使用,可以分别调用不同的模型;
不同模型的切换非常简单;
思考过程的展现和对话内容的输出都非常流畅;
以小程序(或者说网页)的形式提供了40余个大模型,点击并登录就能使用;
界面美观,设计比较现代;
支持翻译、生成图片等等办公中常用的功能;
最新版本可通过申请tavily的API实现全部模型联网搜索,会给出所有的参考链接,每月可以免费使用1000次,解决了下文会说到的部分API无法联网获取最新信息的问题,默认会提供5个搜索结果,可调整至最多20个,并且可以设置搜索结果黑名单,屏蔽来自部分网站的搜索结果。
不足:
暂无手机端App,仅有电脑端App;
对话记录和模型设置无法做到多端同步(没有账号系统,希望后续能够上线);
支持知识库功能的模型非常有限,我接入了DeepSeek官方、硅基流动、火山方舟三家的多个模型,其中仅有硅基流动提供的BAAI/bge-m3向量模型支持知识库。
3、哪家的API好用?
DeepSeek官方提供的API:
服务不稳定,经常遇到因繁忙不响应的情况,且API本身不支持联网搜索最新信息,时不时的就用英文回答我,像极了GPT-4刚上线那段时间。
硅基流动提供的API:
服务稳定性居中,偶尔会不响应,或者响应速度比较慢,且API本身不支持联网搜索最新信息,也会时不时的就用英文回答我。
不知道大家有没有遇到这个问题,硅基流动的API貌似需要先充值(充几块钱就行)才能使用,如果不充值会提示连接失败,充值之后立刻就能正常使用。
火山引擎提供的API:
服务稳定,响应速度快,在我使用的这段时间基本没有遇到不响应的情况,且API本身就已支持联网搜索最新信息(唯一的不足是看不到具体参考了哪些链接)。
综上,目前看来最稳定、功能最完整的API,是火山方舟提供的deepseek-r1 。
3、哪家的API更便宜?
DeepSeek官方API价格(deepseek-reasoner):
百万tokens输入(缓存命中)1元,百万tokens输入(缓存未命中)4元,百万tokens输出16元。
硅基流动API价格(Pro/deepseek-ai/DeepSeek-R1):
百万tokens输入4元,百万tokens输出16元,目前赠送14元。
火山引擎API价格(deepseek-r1):
百万tokens输入4元,百万tokens输出16元,目前赠送50万tokens免费额度。
综上,个人比较推荐的两个组合是:
电脑端:Cherry Studio+火山引擎/硅基流动的DeepSeek API
手机端:腾讯元宝/Chatbox+火山引擎的DeepSeek API
大家还有哪些用起来很顺手的组合?欢迎讨论。
最初发布于2025年3月5日
华为发布面向2025十大趋势 VR/AR/AI等技术融合应用将带来超级视野
5G、云、IoT、AI的融合应用正在塑造一个万物感知、万物互联、万物智能的世界,它比我们想象中更快地到来。
华为在近日发布《全球产业展望GIV@2025》,提出智能世界正在加速而来,触手可及,并预测:到2025年,智能技术将渗透到每个人、每个家庭、每个组织,全球58%的人口将能享有5G网络,14%的家庭拥有“机器人管家”,97%的大企业采用AI。
《全球产业展望GIV@2025》于2018年首次推出,初衷是打开智能世界的产业版图,为各行各业创新增长提供路径参考。
2019年,华为基于对交通、零售、金融、制造、航空等17个重点行业的案例研究,并结合定量数据预测,进一步提出了面向2025的十大趋势,呈现了一个触手可及的智能世界。
这十大趋势分别是:
趋势一:是机器,更是家人
随着材料科学、感知人工智能以及5G、云等网络技术的不断进步,将出现护理机器人、仿生机器人、社交机器人、管家机器人等形态丰富的机器人,涌现在家政、教育、健康服务业,带给人类新的生活方式。
《全球产业展望GIV@2025》预测:2025年,全球14%的家庭将拥有自己的机器人管家。
趋势二:超级视野
以5G、AR/VR、机器学习等新技术使能的超级视野,将帮助我们突破空间、表象、时间的局限,见所未见,赋予人类新的能力。
《全球产业展望GIV@2025》预测:2025年,全球的VR/AR用户数将达3.37亿,采用VR/AR技术的企业将增长到10%。
到2025年,全球5G网络覆盖率将达到58%。届时,5G、4K+、VR、AR和AI技术的融合应用不仅能为人们带来全新的体验“超级视野”,它让人们能够以前所未有的方式看待事物,提高各个垂直行业的生产力。“超级视野”能跨越距离、表象和时间,为个人、企业和社会带来巨大利益。
突破距离
电力:目前,天然气资源占世界能源资源总量的22%,需求量每年增长1.6%。天然气一般由陆地管道输送,绵延数千公里,往往要穿越人烟稀少的偏远地区或恶劣复杂的地形,难免出现管道破损,造成天然气泄漏。在美国,年均管道事故近90次,导致1000万个家庭燃气供应不足。
管道上的一处破裂,往往需要有经验的工程师奔波几周甚至上月才能找到,而维修施工缺陷又进一步降低了管道维修的效率。维修施工缺陷是造成燃气管道事故的第三大原因。
然而,“超级视野”让这一切都发生了变化。到2025年,搭载着5G传输器和4K摄像头的管道巡检机器人将代替工程师监控和检查管道。工程师坐在控制室里就能看到管道周围的环境,随意调转视角看清管道损坏的细节原因,进而给出判断,指挥管道机器人进行维修。据预测:到2025年,全球电站设备巡检机器人数量将达到4200台,市场价值超过4.9亿美元,高于2017年的7600万美元。
污水处理系统:污水管道的直径最小为6英寸(150毫米),而污水管道外用混凝土衬砌的隧道直径长达30英尺(9米)。
因此,低压污水处理系统更倾向于在每个连接点使用小型研磨泵。这样的设计导致人工难以检查细小管道是否存在腐蚀、变形和堵塞。但坚固、防水和防尘的机器人巡检车可以突破人类的极限,监控故障并进行小型检修。具有强大计算能力的全自动无绳机器人可以搭载存储器模块,存储视频和图像,传输管道裂缝的高分辨率图像,并检测两个检修孔之间的故障位置和方向,完成人类无法完成的任务。
突破表象
医疗:据世界卫生组织估计,全球约有430万的医护人员缺口,到2030年这一缺口将增加到900万[6]。而5G、VR、AR技术的出现与应用,为全球医疗界带来了“超级视野”,让医疗资源跨越地理和经济差距,让每个人享受到更多、更平等的医疗服务。
眼疾诊断:视力障碍是一个严重的全球性问题。全球大约有13亿人患有近视力或远视力障碍,轻微远视力障碍患者达1.885亿人,中度和重度视力障碍患者达2.17亿人,另有3600万盲人。此外,随着年龄的增长,人眼中的天然晶状体会变得混浊老化,白内障等眼部疾病的发病率也会随之增加,最终影响视力。
在发病前,人类医生很难注意到人眼逐渐发生的变化。人工智能诊断工具可以帮助人们预防可能发生的眼疾并得到及时治疗,防止病情恶化。目前,人工智能机器人能够诊断50多种疾病,诊断精准度堪比人类医生。一项测试表明,相比八名医生会诊,这套人工智能软件能在94%的场合给出相同的诊断结果。为了避免误诊,人工智能机器人采用了一组算法,而非单一算法,因此任何一种算法的错误都会被其他算法推翻。根据诊断概率,该系统会对每个诊断结果的可能性进行评估和评分,并予以注解。
突破模糊
随着数字成像智能化水平的不断提高,扭曲或碎片化的图像能够被转化为清晰的大师级作品。它的工作原理究竟是怎样的呢?人工智能成像技术可以还原被雨水浸湿或沾有污渍的图像、重像素化或低分辨率图像以及被某个元素遮盖的图像。除了图像,这项技术也可用于还原视频。
该技术不仅仅只是先进的图片编辑工具,还能催生可以像人一样分析周边环境的人工智能机器。例如,数字成像技术可以帮助自动驾驶车辆在路况较差和恶劣天气条件下行驶,极大地提高驾驶安全性。
突破时间
建筑和艺术承载了丰富的历史文化。保存、欣赏和传承这些历史文化,是人类发展的共同愿望。
然而,目前我们保护历史文物的技术还不能帮助我们保护人类文明。据国际失踪艺术品记录组织(ALR)统计,全球每年失窃和丢失的文物高达1.2万件。2018年,巴西国家博物馆因为一场大火酿造了人类的悲剧——馆藏2000多万件文物的90%被燃为灰烬。2019年4月,巴黎圣母院失火,损毁严重,其标志性塔尖倒塌。
时间也是建筑和艺术的敌人。虽然罗马斗兽场和雅典帕特农神庙依然庄严屹立、耐人回味,但它们俨然已不是建成之初的模样。
“超级视野”已经成为挽回人类文明记忆的福音,可以让已经消失的历史古迹重现眼前。阿富汗1500年前建成的巴米扬大佛高53米,但在2001年被炸毁。技术人员利用AR技术和先进的3D激光投影仪(光通量为600,000流明,相当于30台电影放映机)使大佛得以1∶1实景重现。这项壮举不仅仅是技术上的成功,而且精准还原了几个世纪以前创造的文化遗产。
在欧洲,VR博物馆可以让更多人领略艺术的魅力。荷兰艺术收藏家乔治·克拉默(George Kremer)曾考虑在一家实体博物馆展出他收藏的74幅来自17世纪荷兰和佛兰德大师的画作,但苦于一直找不到合适的场馆,即便是世界上最好的博物馆,每年也只能接待900万到1000万游客。
趋势三:零搜索
受益于人工智能及物联网技术,智能世界将简化搜索行为和搜索按钮,带给人类更为便捷的生活体验:从过去的你找信息,到信息主动找到你;未来,不需要通过点击按钮来表达你的需求,桌椅、家电、汽车将与你对话。
《全球产业展望GIV@2025》预测:2025年,智能个人终端助理将覆盖90%的人口。
趋势四:懂“我”道路
智能交通系统将把行人、驾驶员、车辆和道路连接到统一的动态网络中,并能更有效地规划道路资源,缩短应急响应时间,让零拥堵的交通、虚拟应急车道的规划成为可能。
《全球产业展望GIV@2025》预测:2025年,C-V2X(Cellular Vehicle-to-Everything)蜂窝车联网技术将嵌入到全球15%的车辆。
趋势五:机器从事三高
自动化和机器人,特别是人工智能机器人,正在改变我们的生活和工作方式,他们可以从事处理高危险、高重复性和高精度的工作,无需休息,也不会犯错,将极大提高生产力和安全性。如今,智能自动化在建筑业、制造业、医疗健康等领域中广泛应用。
《全球产业展望GIV@2025》预测:2025年,每万名制造业员工将与103个机器人共同工作。
趋势六:人机协创
以人工智能、云计算等技术的融合应用,将大幅度促进未来创新型社会的发展:试错型创新的成本得以降低;原创、求真的职业精神得以保障;人类的作品也因机器辅助得以丰富。
《全球产业展望GIV@2025》预测:2025年,97%的大企业将采用AI。
趋势七:无摩擦沟通
随着人工智能、大数据分析的应用与发展,企业与客户的沟通、跨语种的沟通都将可能变得无摩擦,因为精准的信息到达,人与人之间更容易理解、信任彼此。
《全球产业展望GIV@2025》预测:2025年,企业的数据利用率将达86%。
趋势八:共生经济
无论身在何处、语言是否相通、文化是否相似,数字技术与智能能力逐渐以平台模式被世界各行各业广泛应用。各国企业都有机会在开放合作中,共享全球生态资源,共创高价值的智能商业模式。
《全球产业展望GIV@2025》预测:2025年,全球所有企业都将使用云技术,而基于云技术的应用使用率将达到85%。
趋势九:5G,加速而来
大带宽、低时延、广联接的需求正在驱动5G的加速商用,将渗透到各行各业,并比我们想象中更快地到来。
《全球产业展望GIV@2025》预测:2025年,全球将部署650万5G基站,服务于28亿用户,58%的人口将享有5G服务。
趋势十:全球数字治理
触及智能世界,遇到了新的阻力和挑战。华为呼吁全球应该加快建立统一的数据标准、数据使用原则;并鼓励推动建设第三方数据监管机构,让隐私、安全与道德的遵从,有法可依。
《全球产业展望GIV@2025》预测:2025年,全球年存储数据量将高达180ZB。
以上内容摘自华为《全球产业展望GIV@2025》。
最初发布于2019年8月8日
英国军火商积极测试 未来军舰将通过AI/VR实现远程控制?
未来的海军或许可以使用新技术让舰员们远程操控。像是人工智能和虚拟现实这样的技术能够让一些舰员们在岸上工作,甚至是在千里之外控制军舰的关键功能。这种“半自治”的军舰,需要更少的船员,也就意味着会有更少的人身处战争的险境。
外媒报道,在未来,英国皇家海军可以使用AI和VR来减少船员的规模。类似于在千里之外控制着无人机的操作员,舰员们可以远程工作,比如控制军舰上的传感器或武器。当他们在陆上的基地工作时,可以远离前方的战火。甚至军舰的舰长也可以在岸上,在陆上的基地里指挥他的战舰。
英国军火商BAE系统公司一直在向英国皇家海军推广这项技术。“与军舰上那些坐满军官的控制室不同的是,为了防止军舰受到敌方攻击时控制室也被波及,在陆上的控制室中,军官们能够在其中自由走动,”BAE的一位代表向媒体表示。
飞机将会是首个被远程操控的武器系统。通常飞机都由一位或两位飞行员进行操控,这种短程的任务不需要额外的维护工作,并且相对而言是可支配的。而军舰就不同了,通常军舰都是需要数十人来处理数百项任务,有时会在海上航行数月时间,需要大量经过训练的舰员在离岸数百英里的军舰上进行维护工作,并且很容易就会耗费数十万美元甚至更多。可以说,操纵军舰的复杂性对于使用AI和VR的舰员或陆上的控制室来说是难度最高的任务。
在岸上工作的舰员还会遇到另一个问题:海军需要保证他们的战舰被敌方围堵,或者被迫不使用雷达和通讯信号来进行操控的情况下依然可控,因为敌军将会用这些信号来定位他们。同时,军舰也可能会被敌军攻击,或者受到其他损害,使军舰的动力或通信功能失效。在最坏的情况下,如果军舰和岸上指挥部的联系中断了,那些在岸上基地中远程执行的工作将无法完成。
同时,BAE系统公司还在测试增强现实技术,可以让负责军舰安全的值班人员即使在控制室之外也能够看到战术数据和其他重要的信息。“我们将会使用微软HoloLens在明年3月25日至4月11日的皇家海军Information Warrior 19演习期间首次展示。目前,我们还在使用Striker II飞行员头盔来为皇家海军开发这一系统。”
不过,要在军舰上使用这种增强现实设备,还需要面对强光照和复杂的海面状况等问题,BAE希望对Striker II头盔技术的应用能够帮助解决这一问题。目前的测试虽然进展顺利,但却不够高效,尤其是有大量来自军舰和陆上的各种传感器的数据需要呈现给操作员。
另外,BAE系统公司还在和电脑制造商戴尔合作,来开发更安全的WiFi技术,将舰桥与控制室更好地进行连接。
“虚拟现实、增强现实,触控、手势控制,语音控制…这些都是我们目前正在探索的技术。当然这些技术并不全都适合用在皇家海军的军舰控制室,但肯定有一些是合适的,” BAE系统公司的作战系统技术总监Frank Cotton说道。
最初发布于2018年11月29日
原文链接:https://www.popularmechanics.com/military/navy-ships/a25322684/remote-warships-ai-vr/
不止培训飞行员 美国空军计划将AI/VR融入各部门日常训练
美国空军训练部门的负责人在近日表示,他们希望人工智能可以成为首选的训练技术,帮助空军人员更快和更好地进行训练。
Steven Kwast中将是美国空军教育与训练指挥部的司令官,他表示,他希望预定于明年完成的测试结果,能够表明这些先进的工具,比如AI、虚拟现实和超级计算,能够提升人脑的速度和效率。
“目前已有的测试数据结果是非常积极的,我们能够强化人的大脑,以更快、更好地学习,并且我要说,记忆效果也更好,这就意味着你会更长久更更好地记住知识,”Kwast在美国空军协会空、天网络会议期间对记者们表示。
他以如何将人工智能用于飞行模拟器为例进行了讲解。
“我们来看一下,比如,一个飞行员必须进行一个翻转动作,在飞行员进行此动作时,人工智能会进行观察。并且,当你向后拉控制杆时,人工智能会分辨出你在做什么,它会告诉你‘嘿,你向后拉的幅度太大了,’或者‘嘿,你的鼻子有点向右歪了,你需要保持目光朝前,’”Kwast说道。“也就是说人工智能在看着你。它会向你学习,并且学习你是如何学习的,然后它会给出你建议,帮助你实时适应学习内容,这样一来你就不会出错。”
随着创建逼真的3D训练环境的成本变得越来越低,AI能够调整这一环境,使其适合人们学习的方式,他说道。“AI甚至还能给出建议,比如,‘你更加适合使用视觉内容进行训练,或者更加易于接受文字内容。你最好先阅读,然后再操作。或者你最好先观看,然后再操作。’这就是人工智能正在帮助我们做的事情。”
Kwast说,测试结果将会在明年夏天完成,并且将会应用在除飞行员训练以外的更多领域。
“这其中包含了空军所需要的所有技能,”他说到。“无论你是维护人员,还是网络专家,又或者是防空兵,或者飞行员,这些都可以应用AI。这是关于人类学习工作技能的一项技术。问题在于,你是否能够以新奇的、实用的方式来使用这项技术,强化训练的效果。”
美国空军官员指出,AI能够被用于补充教官资源的不足,并且让学生们能够在任何时候接触到训练内容,且不会学到教官的坏习惯。
“我们正在寻求去除训练和教育环节中的人为因素的方法,”Jim Sears准将说道。他是美国空军教育与训练指挥部旗下计划、程序和需求部门的负责人。“同时也在寻求简化训练过程,增强训练效果并且使训练变得更好的方法。”
最初发布于2018年11月20日
原文链接:https://www.military.com/daily-news/2018/09/18/air-force-wants-use-artificial-intelligence-train-pilots.html
美国空军中将的担忧:在人工智能上 美国已经落后于中国
近日美国空中一位中将表示,中国在人工智能技术领域的大量投入,将很快把美国甩在后面,使美国处于不利地位。
“在数字时代,速度是发展的根本,”VeraLinn “Dash” Jamieson中将说道。她是五角大楼空军参谋部负责智能、监控和侦查(ISR)的副参谋长。
她描绘了一幅可怕的画面:当俄罗斯有想要用AI作一些雄心勃勃的实验的想法时,中国已经有了这些手段。
比如,中国正在积极努力想要成为AI技术的全球领导者,比如以军民合作的形式创建数字化的人工智能城市,以了解AI技术能够如何被复制和应用。这些城市通过人工智能的面部识别软件跟踪人们的行动,监控着生活在其中的市民的每个举动。
“据我们估计,在2017年,中国在人工智能系统方面的投入总额达到了120亿美元。我们预计,到2020年,这一数字将会达到至少700亿美元,”Jamieson在空军协会的一次早餐上说道。
“你可以对比下我们的投入和中国的投入,”她补充道。
五角大楼中的每一个军事部门都在不同程度地推动着AI的发展,不过其投入规模仅有数十亿美元。
根据独立调研机构Govini的数据,五角大楼在2017财年在新兴技术研究上花费了大约740万美元,而AI在其中占比仅有大约33%,这些花费还包括量子计算和大数据分析,以及其他的信息技术研究。
因为美国空军在过去的二十年间一直都在大力投入反恐作战,“我们并没有纵观全局,来思考并且创建和开发一个高端的战略,我们只看到了我们今天正在面对的战争,”Jamieson说。“今天我们的[智能、监控和侦查]能力还不足以应对国防战略中提出的发展意图所带来的挑战。”
Jamieson正在推动着美国空军的智囊团以不同的方式来思考它该如何行使自治权。比如,他们正在从讨论一个单独的、先进的武器到更广泛地讨论要发展新兴技术,必须要网络先行。
她还重申了与去年相似的评论,Jamieson表示,她的目标在于使用AI从数百万的智能数据点和传感器整合数据点中筛选数据,比如可视或可听传感器的数据,给予空军需要实时做出的决策,这能在实际的战场或虚拟战场中帮助他们。
“我们的确需要我们的分析人员来协调这些数据,以获得更高质量且更快的决策,”她说道,并且还补充说“我们必须构建下一代的ISR(智能、监控和侦查)能力,使我们能够从冲突的全局高度占据决策上的优势。”
Jamieson还推动了一项文化的变革,在此之前美国空军一直在纠结于这一问题,即如何从人力密集型的处理方式调整到利用机器学习和人工智能的处理方式。处理过程将会由数据开始,到数据分析和机器智能,再到人机合作,她说。
“军工企业和空军将会被要求提升ISR的质量和数量,同时能够保持胜任各种军事行动。我们将会共同推进这些研究,”她说道。
Jamieson还说这项研究决不能仅仅将大数据收集作为一个信息来源。“数据就是武器,并且我们每个人都需要以这样的看法来对待数据。”
基于此,目前的空军和未来的空军都需要“被释放,”她补充道。
今天的美国空军要真正地理解真实世界和虚拟世界的融合,这对于应对下一场面对俄罗斯或中国的战争来说,是非常必要的,她说。
Jamieson说在最近几个月,她约见了一些能够通过编码技术整合来自各种不同平台的数据的空军官兵。
“来自第480 ISR联队的空军官兵们意识到,他们在最喜欢的游戏能够被用于培训,这款游戏可以支持大约55名用户之间的实时协作,以完成一项任务。”她说道。
这些空军官兵创建了一个低成本的军用版本,名为Sentinel Sim。Jamieson表示,如果是由空军来开发,或者外包开发的话,可能会花费数百万美元。
而在今天,这个游戏已经被用于实际任务训练场景。
美国空军、军工企业和五角大楼已经成为了一个整体,“现在这已经成为了一项团体运动,”Jamieson说。“并且我们必须这样看待它。”
最初发布于2018年9月3日
原文链接:https://www.military.com/defensetech/2018/07/30/china-leaving-us-behind-artificial-intelligence-air-force-general.html