花都区营销型网站建设中国山东建设监理协会官方网站

张小明 2026/1/6 1:03:44
花都区营销型网站建设,中国山东建设监理协会官方网站,落地页制作用什么软件,广州做网站的网络公司点击上方“小白学视觉”#xff0c;选择加星标或“置顶” 重磅干货#xff0c;第一时间送达作者#xff1a;Immortalqx等人 | 编辑#xff1a;计算机视觉工坊本文转载自公众号#xff1a;计算机视觉工坊作者#xff1a;Immortalqx等人连接#xff1a;https:…点击上方“小白学视觉”选择加星标或“置顶” 重磅干货第一时间送达作者Immortalqx等人 | 编辑计算机视觉工坊本文转载自公众号计算机视觉工坊作者Immortalqx等人连接https://www.zhihu.com/question/1975877695788319146自己的研究课题是SLAM发现SLAM发论文很难甚至在投稿时遇到了编辑回复深度学习SLAM已经很厉害了传统SLAM没有研究价值。但据我所知目前的深度学习SLAM在各项指标上还是比不过传统SLAM。另外虽然SLAM已有30多年的历史但目前产业落地依然是难题。有人说目前VLAVLN的研究已经不需要建图了。但我虽然理解神经网络在给出目标后可以靠隐式表达地图规划路径不过这种特性显然不能应用在大规模场景中而且明显每换一个场景就需要训练除非网络输出一个隐式表达地图然后靠这个地图定位我见过这个方向的研究。建图定位才是统一的解决方案啊为什么总是听说SLAM已死找工作也不好找补充一点我个人认为目前机器人要脱离遥控的方向就是SLAMVLA总之离不开建图为啥岗位会减少呢Immortalqx的回答SLAM似乎处于一个比较尴尬的阶段。在工业界SLAM似乎“不被需要”了自动驾驶的岗位需求减少了而且SLAM的应用似乎更偏向于“标注”而不再是导航定位了。一些具身智能的初创倒是招聘做SLAM的同学不过不太清楚他们怎么用SLAM。在学术界近几年的SLAM大部分都是围绕NeRF、3DGS建图或者围绕如何利用3D Foundation Model来展开的研究。个人觉得这些工作离落地就比较远了这些方法都很难做到real-time不太适合放到机器人上来用。传统SLAM还是有很多没有解决的问题举一个例子内参随时间变化的时候怎么做SLAM或者VIO比如我用手机绕着一个物体拍视频中间我觉得自己走远了于是我进行了一下缩放那么手机上跑的VIO怎么准确的估计pose呢最近NeurIPS有篇工作《InFlux: A Benchmark for Self-Calibration of Dynamic Intrinsics of Video Cameras》涉及到了这种手机拍视频变焦的情况。再举一个例子对于多目的SLAM添加新的相机应该是能给SLAM带来增益的但是如果相机之间的相对位置一直在改变呢比如人形机器人头顶一个相机、身体一个相机、手臂上还有相机我们只用身体的相机做SLAM吗还是尝试把所有相机都利用起来呢不过这两个例子可能太极端了已经涉及到SLAM长期依赖的一些假设了比如我们提前标定好内外参数那么跑SLAM的时候内外参数应该是不变的而对于多相机系统来说相机应该是同步触发的。抛开这些涉及到基本假设的方向我也想不出传统SLAM还有什么可以做的地方了也许引入一些新的传感器再看“VLA、VLN不需要建图”这个问题很遗憾我是做3DGS SLAM的只对3dgs、视觉SLAM稍微有了解今年我参加了空间智能论坛有听到讲者说VLA泛化性的问题大概意思是以前的工作都是一个网络解决VLA问题但是他们尝试了用大网络小网络来解决大网络用来理解空间小网络用来执行操作而且面对新场景他们只需要训练或者微调小网络我不记得工作名字和具体的内容了当时的印象大概是这么一回事。那我就产生了一个很奇妙的想法如果未来隐式表达的地图表示方法真的成为了主流那会不会出现“黑哥哥们的语言是不互通”bushi的情况比如单机已经能成功跑通了甚至做到了实时的学习微调那么如果两台机器各自“经历一些事情”之后他们的embeddings表示有差异了怎么办怎么来做多机协同很可惜我不太懂这个领域我不确定会不会真的有这种情况不过我感觉显示表示作为基础结合一些隐式表示的方法可能是近几年最佳的解决方案。毕竟机器人最后还是要服务于人的显示表示显然更有利于人看懂地图、下达指令、和机器人交互而结合隐式表示也许可以让机器人更好执行任务。今年字节seed发布了一篇技术报告《Astra: Toward General-Purpose Mobile Robots via Hierarchical Multimodal Learning》这篇工作的地图是显式的、结构化的可以看看论文的“3.1.1 Offline Mapping”章节。我对这篇工作的看法是这篇工作说明目前机器人的路线还是不确定的没有说一定要显式或者隐式的地图才能XXXXXX我们可以探索VLN也可以探索如何显式的构建地图然后用multimodal LLM做导航可以端到端也可以模块化。这件事情既然还不确定、还有争议那它一定值得我们来探索和研究。老码农的回答我觉得传统slam并没有死相反基于深度学习的也无法活的太久。nerf虽然理论优美完美契合深度学习但太慢费卡没法实用。3dgs官方几个demo竟然需要几百张照片因为基于椭球染空间中到处是可见椭球最重要的很少有人真正做出demo的效果这个花费我很多精力研究理论代码最后只不过是个toy。vggt以及那些DepthAnything能预测出一些深度图但精度远远不够就算做个简单的杯子也歪歪扭扭不成型。混元tripoai前者投入不少钱后者拿到不少钱但他们都基于原始开源项目zero-123一张图重建号称革命游戏动画电影实际精度远远不够生成个中间残次品不如建模师从头捏。sam3d最近facebook这个吹上天的单图重建跟那个混元没有本质效果区别但稍微好了些对实物精度依然不够。深度学习变成无脑堆数据在搜广推及11m中是可以的但若要求建模精度在0.1mm这些毫无理论的粗旷方法也是达不到的。但在自动驾驶领域吧那些端到端也是适合的自动驾驶对数据精度要求没那么高从人的驾驶行为中学习路径规划也是合理的、这是传统规则做不到的。Ryan的回答经过几日的总结我自己发现了这个问题的原因。我自己来回答一下这个问题。先总结技术落地难企业挣不到钱。SLAM分为传统SLAM和目前基于深度学习的SLAM。根据功能分又分为建图定位SLAM以及三维重建SLAM。要分析这个问题抓住了一条企业能不能用来挣钱。完全基于深度学习的SLAM就不必说了。例如MASt3R-SLAM VGGT-long等效果很惊艳但目前仅在学术领域崭露头角工程应用还需要探索。而传统SLAM用于实际应用有很多长尾问题需要解决实际落地较难。这导致企业投入较大产出较小。企业挣不到钱自然工资不会很高。这造成了SLAM领域一个很奇怪的现象明明学习SLAM既需要较好的编程经验又需要学习相机模型相机标定惯导模型BA优化各种优化库李群李代数等各种繁杂又有难度的知识但其工资却比不过一个链式求导规则到处应用的深度学习。从而导致论坛帖子到处都是“SLAM狗都不学”的劝退之声。这里我们会发现技术不是难度越大工资越高。我们需要看看能不能轻易变现。而三维重建SLAM由于仅需建好图视觉效果好就可以进行宣传与使用。不需要解决长尾问题使得落地难度小变现快企业更喜欢。刚说了落地难的问题再说应用场景收窄的问题。前几年因为VR和自动驾驶的火爆导致岗位增多但最近因为VR领域变冷自动驾驶又开始使用无图端到端技术。导致SLAM的用武之地进一步减少。目前使用较多的地方大多是移动机器人领域例如扫地机器人人形机器人无人机工厂的VGA等。这导致了工作岗位少毕业学生多供大于求的情况。基于以上的情况SLAM现在处于一个负反馈闭环环有问题还没解决。导致企业变现难。导致研究投入少导致有问题还没解决。以我短浅的目光来看目前要打破这个局面的一个可能是具身智能的火爆引发资本发现要脱离遥控的基础技术是SLAM从而加大投入。但目前来看也仅仅只有这一个需求应用。这个问题解决泡沫就会迅速褪去。不会像深度学习技术一样在语音视觉自然语言处理等多个领域扩展为众多子领域遍地开花。总结一下就是SLAM难入门应用场景相对缩小企业变现难即使突然火起来也不会持续太久技术问题解决热度就会褪去。Biang哥的回答我说的不一定对有不准确的还请大佬们提醒我觉得slam的一个问题是相比较于曾经寄期望的领域比如自动驾驶这个技术的效果回报率太低了很多时候需要花费大量精力时间去解决小概率的corner case虽然它们发生的概率较小但是一旦发生了可能就是不可承受的后果再加上随着环境变化corner case是做不完的你的策略总需要去照顾这些积累下来的问题也就是投入不成比例的精力去做那些边角料而且正常的运行条件都不一定能做明白。而slam导航的amr设备现在要求相对比较低本身它的工况就是人机协作在一块场地速度提不起来也就是2-4m/s以下场景很容易做适配改造比如减少反光材质保证点云质量去掉噪点最后难点不在导航而是设备本身的降本。可能不需要那么多人做很多的开发。现在只能跟着robotics如果amr不算机器人的话要口饭吃。daydayupzhang的回答从学术上来讲应该说是传统SLAM近期的新理论新发展比较少了现有的库工程优化很强能够形成创新点且容易实现的点变少了。相比而言大模型、VLN等路线处于有一定前景但还不成熟的阶段正适合学术探索。从找工作上来讲应该说是SLAM供大于求了需要SLAM的岗位没有增加还减少了但学SLAM的人还在增加前些年SLAM火爆的时候入局的人数基数也比较大。本文仅做学术分享如有侵权请联系删文。下载1OpenCV-Contrib扩展模块中文版教程 在「小白学视觉」公众号后台回复扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。 下载2Python视觉实战项目52讲 在「小白学视觉」公众号后台回复Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目助力快速学校计算机视觉。 下载3人工智能0基础学习攻略手册 在「小白学视觉」公众号后台回复攻略手册即可获取《从 0 入门人工智能学习攻略手册》文档包含视频课件、习题、电子书、代码、数据等人工智能学习相关资源可以下载离线学习。 交流群 欢迎加入公众号读者群一起和同行交流目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群以后会逐渐细分请扫描下面微信号加群备注”昵称学校/公司研究方向“例如”张三 上海交大 视觉SLAM“。请按照格式备注否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告否则会请出群谢谢理解~
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

做博客网站要什么技术临沂建站程序

第一章:【掌握未来社区主动权】:Open-AutoGLM驱动的5大服务联动场景在智能化社区生态加速演进的今天,Open-AutoGLM 作为开源自治语言模型引擎,正成为连接物理空间与数字服务的核心枢纽。其通过自然语言理解、任务编排与多系统接口…

张小明 2026/1/6 12:28:38 网站建设

网站开发技术的比较网站建设优秀公司

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 制作一个面向新手的MySQL字符集教学工具,包含:1. 基础概念讲解动画 2. 错误重现演示 3. 分步解决向导 4. 交互式练习环境 5. 常见问题解答。要求使用简单明了…

张小明 2026/1/6 18:41:11 网站建设

淮北矿业集团工程建设公司网站django开发的公司网站

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个面向初学者的MT3608教学项目,包含:1)芯片引脚功能可视化图示;2)面包板搭建教程视频脚本;3)常见故障排查指南;4)互…

张小明 2026/1/6 20:46:02 网站建设

网站上资源截图怎么做做电商都需要什么

Wan2.2-T2V-A14B模型在图书馆数字资源导览中的应用探索 在数字化浪潮席卷公共文化服务的今天,一个现实问题愈发凸显:我们已经完成了大量古籍扫描、元数据标注和数据库建设,但这些“沉睡”的数字资源,对大多数普通读者而言依然遥远…

张小明 2026/1/6 22:02:02 网站建设

济南网站建设认可搜点网络公司公关是陪吃陪喝的吗

LangFlow投资组合建议生成器逻辑架构 在金融服务日益智能化的今天,如何快速构建一个既能理解用户需求、又能结合市场数据与合规要求生成个性化投资建议的系统,成为金融科技团队的核心挑战。传统的开发模式往往依赖大量手写代码串联LLM调用、外部数据查询…

张小明 2026/1/4 9:40:39 网站建设

家居网站建设如何各大网站地区是怎样和做的

最新数据显示,2024年中国大模型市场规模已达294.16亿元,其中多模态大模型贡献156.3亿元,数字人、游戏等场景应用增长迅猛;更有预测指出,2026年这一市场规模将突破700亿元大关。 图源自36氪研究院 市场竞争梯队也逐渐清…

张小明 2026/1/4 9:38:35 网站建设