当前位置:网站首页>NVIDIA开源了基于PyTorch的3D深度学习的综合库
NVIDIA开源了基于PyTorch的3D深度学习的综合库
2022-07-19 09:41:00 【小白学视觉】
点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
编辑:Sophia
转载于 :https://techxplore.com/news/2019-11-kaolin-comprehensive-library-d-deep.html
由于大多数真实世界环境都是三维的,因此设计用于分析真实世界环境中的视频或完整任务的深度学习模型也应该合乎理想地是在三维数据上进行训练。诸如机器人、自动驾驶汽车、智能手机和其他设备之类的技术工具,目前正在生成越来越多的三维数据,这些数据最终可能会被深度学习算法进行处理。
但到目前为止,必要的工具和平台只有一些人工智能研究人员才能使用,这使得在海量的三维数据上训练深度学习算法一直较为困难;为了解决缺乏现成工具的问题,NVIDIA的一个研究团队最近创建了一个名为“高岭土”(Kaolin)的PyTorch开源库,旨在推进和促进三维深度学习研究。
论文地址:https://arxiv.org/pdf/1911.05063.pdf
开展这项研究的一个研究人员说:“目前,还没有一个单一的开源软件库能够支持三维数据的多种表现形式、多种任务和评估标准;我们决定通过创造Kaolin来弥补这一空白,这是第一个综合性的三维深度学习库。”
Kaolin包含各种构造深度学习架构的工具,可以分析三维数据,且兼具有效性与易用性,允许研究人员在将其用于训练深度学习算法之前,加载、预处理和操纵三维数据。Kaolin还包含几个图形模块来编辑三维图像(如渲染、照明、阴影和视图扭曲),且支持广泛的损失函数和评估指标,使研究人员可以很容易地评估他们的深度学习算法。
无论是对于在开发深度学习模型方面经验丰富的开发人员,还是对于刚刚起步的开发人员,Kaolin都是一个有价值的工具。实际上,开发人员在库中还可以找到几种最先进的架构,他们可以将其作为自己模型的起点或灵感来源。虽然活跃的三维深度学习研究人员将Kaolin视为加快研究速度的一种有效手段,但进入该领域的新手也正将Kaolin作为开始的起点。在将来,Kaolin还能帮助开发人员加速三维深度学习研究,协助开发人员创建新的人工智能架构以及对其进行培训和评估。同时,NVIDIA的研究人员还在计划扩展Kaolin并进一步增强其功能,使Kaolin成为三维深度学习研究的一站式平台。
好消息!
小白学视觉知识星球
开始面向外开放啦
下载1:OpenCV-Contrib扩展模块中文版教程
在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。
下载2:Python视觉实战项目52讲
在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。
下载3:OpenCV实战项目20讲
在「小白学视觉」公众号后台回复:OpenCV实战项目20讲,即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。
交流群
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~
边栏推荐
- Discussion on segment tree · number of ordinary segments | number of multiplicative segments | chairman tree
- [Mamba] is CONDA slow?
- QT plays audio and video files with errors directshowplayerservice:: dorender: unresolved error code 0x80040266
- [papers] famous conferences and periodicals
- Degradation technology of template and generic programming
- Go语言 常量与运算符
- When flinkcdc synchronizes data from sqlserver to MySQL, the timestamp xdbmask is in sqlserver
- Qt | 通过创建一个简单项目了解Qt Creator
- Web3创业具备创新爆炸式增长的所有要素
- 开发那些事儿:Go与C类型转换出现内存泄漏该如何解决?
猜你喜欢
Preliminary understanding of Panda3D fog
Go语言 常量与运算符
Get started with vite
OpenHarmony littlefs文件系统存储结构与IO性能优化分析
Rk3399 platform development series explanation (interprocess communication) 14.10. How to view process scheduling information
RK3399平台开发系列讲解(进程间通信)14.10、如何查看进程调度的信息
Write "Hello, china." for domestic smart watches with C #
Reading notes - shopping mall
QIODevice
Nacos配置管理——配置共享
随机推荐
【JS】this指向的问题
【无标题】了解dNet应用程序域
[papers] famous conferences and periodicals
[Kingbase] data type formatting function
幼儿园核酸预约登记小程序实战开发(上篇)
Find - b+ tree
Is it safe to open an account in Shanghai Securities?
Feign入门之快速实战
Go语言 流程控制
How to implement dynamic submission of SQL jobs and control of startup and shutdown?
Several small open source projects of mine over the years
Stm32+bh1750 photosensitive sensor obtains light intensity
为什么独立站卖家喜欢做电子邮件营销?原来转化率能提高这么多!
关于部署ogg 微服务的一些疑问
NGFW的用户认证
浏览器调试
QT plays audio and video files with errors directshowplayerservice:: dorender: unresolved error code 0x80040266
How to carry out "small step reconstruction"?
在不切换分支的情况下查看不同分支中的文件
性能提升30倍丨基于 DolphinDB 的 mytt 指标库实现