English· Español· Deutsch· Nederlands· Français· 日本語· ქართული· 繁體中文· 简体中文· Português· Русский· العربية· हिन्दी· Italiano· 한국어· Polski· Svenska· Türkçe· Українська· Tiếng Việt· Bahasa Indonesia

un

访客
1 / ?
返回课程列表

欢迎

欢迎来到机器人学——这是一门工程学科,融合了机械、电子和软件,用来构建能感知、决策和行动的机器。

机器人这个词源于捷克语robota,意思是强制劳动。卡雷尔·恰佩克在1920年的一部戏剧中创造了这个词。一个世纪后,机器人焊接汽车、探索火星、进行手术、打扫客厅。

并非每台自动化机器都是机器人。烤面包机是自动化的——它加热和弹出——但它不能感知环境或适应。机器人有三种基本能力:

- 感知——通过传感器收集有关世界的信息

- 决策——处理该信息并选择行动

- 行动——通过执行器移动或操纵物理世界

The Sense-Decide-Act Control Loop

这个感知-决策-行动的循环持续进行。工厂机械臂每秒检查关节位置数千次。火星漫游车在每个车轮命令之前分析地形图像。循环速度和复杂性各不相同,但结构是相同的。

机器人存在于自主性谱系上。一个遥操作的排爆机器人完全没有自主权——人类进行每一个决策。在仓库中导航和避免障碍物的仓库机器人具有部分自主性。自动驾驶汽车的目标是完全自主,尽管这仍然是一个开放的工程挑战。

机器人的主要类别:

- 工业机器人——固定底座机械臂,在工厂进行焊接、涂装、组装和码垛

- 服务机器人——在非制造业环境中协助人类:手术机器人、递送机器人、清洁机器人

- 移动机器人——在世界中移动:轮式、腿式、履带式、航空(无人机)和水下(ROV和AUV)

本课程涵盖每位机器人学家需要了解的核心要素:执行器、传感器、控制系统、编程概念和职业路径。

热身

快速检查

让我们看看你从哪里开始。

你是否曾经构建、编程或使用过任何类型的机器人或自动化系统?如果有,请描述你所做的。如果没有,当你想到机器人时会想到什么?

电动机和运动

执行器:机器人如何运动

执行器是任何将能量转换为物理运动的装置。执行器是机器人的肌肉。


直流电动机——最简单的电动机。施加电压,轴旋转。反转电压,它向相反方向旋转。速度与电压成正比。直流电动机便宜且快速,但它没有内置的位置检测方式。它们在轮式机器人和简单机制中很常见。


步进电动机——以离散的步长移动,通常每步1.8度(每转200步)。你指定步数,电动机移动完全那么远。步进电动机无需传感器即可提供精确的开环位置控制,但在重负载下可能会失步。在3D打印机、CNC路由器和摄像机云台中很常见。


伺服电动机——一个电动机与位置传感器(编码器)和闭环系统中的控制器相结合。控制器持续比较指定位置与实际位置,并纠正任何误差。伺服电动机提供速度、扭矩和精度的最佳组合。工业机械臂几乎完全采用伺服电动机。


气动执行器——使用压缩空气创建直线或旋转运动。体积小但功率大,但由于空气是可压缩的,精确控制很困难。在工厂夹爪和pick-and-place机器中很常见。


液压执行器——使用压力液体(油)而不是空气。由于液体几乎不可压缩,液压传动以精确控制提供巨大的力。重型建筑设备、大型工业压力机和一些腿式机器人(如波士顿动力公司的早期Atlas)使用液压。权衡是重量、复杂性和液体泄漏的风险。


自由度(DOF)——每个独立的运动轴是一个自由度。典型的工业机械臂有6个DOF:三个用于在空间中定位末端执行器(X、Y、Z),三个用于定向(横滚、俯仰、偏航)。人类手臂有7个DOF。更多的自由度意味着更多的灵活性,但控制和编程的复杂性也更高。

Actuator types: DC motor, stepper, servo, hydraulic, and DOF comparison

选择正确的执行器

匹配执行器到任务

选择正确的执行器需要了解应用要求:速度、精度、力和环境。

一名工程师正在为手术系统设计机械臂。该机械臂必须将手术刀定位到0.1毫米以内,并在切割过程中保持稳定。你会选择哪种类型的执行器,为什么?为什么替代方案会更差?

机器人如何感知世界

传感器:机器人的感官

没有传感器,机器人是盲目和聋哑的。传感器提供驱动每项决策的原始数据。


编码器——测量旋转。光学编码器有一个带有槽的磁盘;光线通过,检测器在磁盘旋转时计算脉冲。这告诉控制器一个关节移动了多远。增量编码器计算相对运动;绝对编码器报告上电时的确切角度。每个伺服电动机都有一个编码器。


IMU(惯性测量单元)——结合加速度计(测量线性加速度)、陀螺仪(测量旋转速度)和有时磁力计(测量磁标题)。IMU告诉机器人它的方向和如何通过空间移动。对于无人机、腿式机器人和任何需要保持平衡的移动平台至关重要。


LIDAR(光检测和测距)——发射激光脉冲并测量每个脉冲反射回来所需的时间。这创建了周围的详细2D或3D地图。自动驾驶汽车和仓库机器人使用LIDAR进行障碍物检测和地图绘制。旋转LIDAR每秒可产生数十万次距离测量。


摄像头——提供丰富的视觉数据,但需要大量计算来解释。单个摄像头提供2D图像;立体摄像头(两个摄像头,分离距离已知)提供深度信息。计算机视觉算法处理摄像头数据以进行物体识别、线跟踪和视觉SLAM(同时定位和制图)。


力/扭矩传感器——测量在一个点(通常在机器人的手腕或末端执行器)施加的力和扭矩。对于需要控制接触的任务至关重要:组装(将销钉插入孔中)、抛光和必须检测与人类接触并立即停止的协作机器人。


传感器融合——没有一个传感器是完美的。LIDAR提供精确的距离但没有颜色。摄像头在黑暗中提供丰富的图像但很困难。IMU随时间漂移。传感器融合结合来自多个传感器的数据,以产生比任何传感器单独更准确和可靠的图景。自动驾驶汽车持续融合LIDAR、摄像头、雷达、GPS和IMU数据。

Robot sensor types: encoder, IMU, LIDAR, camera, force/torque, and sensor fusion

为任务选择传感器

匹配传感器到任务

传感器选择取决于机器人需要知道什么、环境和计算预算。

一家公司正在建造一个在仓库中运营的自主叉车。它必须在货架走道之间导航,避免附近走动的人类,并在精确的位置拾取托盘。你会配备它哪些传感器,为什么?考虑每个传感器贡献什么是其他传感器无法提供的。

开环vs闭环

控制:使机器人表现良好

没有控制的机器人只是一堆零件。控制系统是决策层——它们获取传感器数据并计算驱动执行器的命令。


开环控制——发送命令并期待最好的结果。步进电动机命令执行200步会尝试,但如果在重负载下失步,没有任何东西检测到错误。开环简单且便宜,但不能纠正干扰。微波炉是开环的:它按你设置的时间运行,无论食物是否实际变热。


闭环控制——测量输出,将其与所需值比较,并纠正差异。这是反馈控制,是所有严肃机器人的基础。伺服电动机是闭环的:编码器测量实际位置,控制器比较指定位置,并调整电动机电压以缩小差距。


PID控制——最广泛使用的反馈控制器。PID代表比例-积分-微分

- P(比例):纠正与当前误差成正比。大误差,大纠正。但单独的P经常超调或以小的持久误差稳定。

- I(积分):随时间累积过去的误差。如果系统长时间略微偏离,I会建立并推动更硬。这消除了稳态误差,但如果设置太高可能导致振荡。

- D(微分):响应误差改变的速度。如果误差快速缩小(系统接近目标),D减少纠正以防止超调。D充当阻尼器。

调整PID控制器——找到正确的P、I和D值——部分是科学,部分是工艺。P太多系统会振荡。I太多它会积累和超调。D太多它对噪声有反应。真实机器人通常需要为每个关节进行PID调整。


稳定性——控制系统稳定是指它收敛到所需状态。不稳定的系统以增加的幅度振荡——机器人会自己颤抖散架。稳定性分析是控制工程的核心技能。

PID closed-loop feedback diagram with P, I, and D term explanations

应用控制概念

像控制工程师一样思考

理解反馈和PID不仅仅是理论——它解释了为什么机器人的表现是那样的。

无人机在10米高度悬停。一阵风将其推下到9.5米。走过PID控制器如何响应以将其恢复到10米的过程。P、I和D中的每一个对纠正的贡献是什么?

状态机和ROS

软件:机器人的大脑

机器人软件从根本上与网络或业务软件不同。它实时运行,与物理硬件交互,必须优雅地处理意外情况——丢落的物体、卡住的关节、进入工作区的人类。


状态机——机器人学中最常见的编程模式。状态机定义一组状态(如IDLE、MOVING、GRIPPING、ERROR)和它们之间的转换。机器人始终处于恰好一个状态。事件触发转换。

例如,一个pick-and-place机器人:

- IDLE:等待命令

- MOVING_TO_PICK:前往拾取位置

- GRIPPING:在物体上关闭夹爪

- MOVING_TO_PLACE:携带物体到目的地

- RELEASING:打开夹爪

- ERROR:出了点问题(物体掉落、关节故障、检测到障碍物)

每个状态都有定义的进入动作、退出动作和转换条件。状态机防止机器人执行无意义的操作——你不能释放从未夹住过的物体。


ROS(机器人操作系统)——实际上不是一个操作系统。ROS是一个中间件框架,提供通信基础设施、硬件抽象和大量可重用包库。它在Linux上运行。使用ROS构建的机器人使用发布-订阅架构:传感器节点在话题上发布数据,控制节点订阅它们需要的话题。这种模块化设计意味着你可以在不重写导航代码的情况下交换LIDAR传感器。


路径规划——机器人如何决定从点A到点B的路线,同时避免障碍物。简单的方法包括路径点导航(跟踪一系列预定义的点)和势场(障碍物排斥,目标吸引)。高级方法如A*和RRT(快速探索随机树)在复杂环境中搜索最优或可行的路径。自动驾驶汽车每秒重新规划多次路径,随着世界的变化。

Robot state machine, ROS publish-subscribe architecture, and A* path planning

设计机器人行为

思考机器人软件

好的机器人软件预期故障并优雅地处理。

你正在编程一个移动仓库机器人,从货架上拾取盒子并将其递送到包装站。为此任务设计一个简单的状态机。列出这些状态,对于每个状态,描述什么触发向下一个状态的转换。至少包括一个错误状态并解释什么触发它。

机器人学职业

在机器人学建立职业

机器人学在制造、物流、医疗、农业和国防领域快速增长。这是主要的职业路径。


机器人学技术员——安装、维护、故障排查和修复机器人系统。这是最容易进入的起点。你与硬件动手工作——更换电动机、校准传感器、重新接线控制器和诊断故障。社区学院课程和制造商认证(FANUC、ABB、KUKA)可以让你快速入门。典型的起始工资:45,000-65,000美元。


控制工程师——设计和调整使机器人表现正确的控制系统。这个角色需要强大的数学(线性代数、微分方程)和编程技能。控制工程师致力于PID调整、运动规划、传感器集成和安全系统。电气、机械或机械工程学学士学位是典型的。薪资范围:75,000-120,000美元。


ROS开发人员/机器人软件工程师——编写协调感知、规划和控制的软件。这些开发人员使用C++和Python,构建ROS节点,实施路径规划算法,并为感知集成机器学习模型。强大的计算机科学技能是必要的。这个角色对自动驾驶汽车、仓库机器人和无人机系统的需求很大。薪资范围:90,000-150,000美元。


自动化集成商——为工厂设计和实施完整的机器人工作单元。集成商解决制造问题(以60单位/小时的速率焊接这两个零件),选择机器人、末端执行器、安全系统和传送带,对整个单元进行编程,并在工厂楼层进行调试。集成商需要跨机械、电气和软件的广泛知识。许多人为系统集成公司工作。薪资范围:70,000-110,000美元。


其他路径——创建机器人结构和机制的机械设计师。设计电源系统和电路板的电气工程师。推动操纵、运动和机器学习在感知中的边界的研究科学家。在极端环境中部署机器人的现场机器人学工程师——水下、地下或太空。


共同的主线:机器人学奖励能够跨学科思考的人。一个纯机械的人在没有软件技能的情况下有困难。一个纯软件的人在没有物理学理解的情况下有困难。最好的机器人学家是T形的——在一个领域的深度专业知识,对所有领域的工作知识。

Robotics career paths: technician, controls engineer, ROS developer, automation integrator

你的前进之路

反思

你现在已经涵盖了基本构件:执行器、传感器、控制系统、编程模式和职业路径。

根据你在本课程中学到的内容,机器人学的哪个领域最吸引你,为什么?你在接下来的一个月内可以采取一个具体步骤来开始在该领域建立技能?