Toyota está ensinando robôs a preparar o café da manhã com IA

A Toyota está usando IA e o sentido de tato para treinar robôs a realizar tarefas complexas, na busca pelos Grandes Modelos de Comportamento
Ana Luiza Figueiredo19/09/2023 20h59, atualizada em 20/09/2023 20h54
Compartilhe esta matéria
Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Siga o Olhar Digital no Google Discover

O Toyota Research Institute (TRI) está revolucionando a maneira como os robôs aprendem a realizar tarefas complexas, como preparar o café da manhã, por meio do uso da inteligência artificial (IA), como mostra um vídeo divulgado pela empresa para demonstrar a técnica inovadora de treinamento.

Ofertas

Stickman Warriors: Monster Survival Battle Game 3D
Vendido por Amazon
Stickman Warriors: Monster Survival Battle Game 3D
Por R$ 32,51
Samsung Smart TV 75" Crystal UHD 4K U8100F 2025
Vendido por Amazon
Samsung Smart TV 75" Crystal UHD 4K U8100F 2025
De: R$ 5.299,99
Por: R$ 4.519,90
Notebook Dell Inspiron I15-I1300-A60P 15.6" Full HD 13ª Gen Intel Core i5 16GB 1TB SSD Win 11 Preto Carbono
Vendido por Amazon
Notebook Dell Inspiron I15-I1300-A60P 15.6" Full HD 13ª Gen Intel Core i5 16GB 1TB SSD Win 11 Preto Carbono
Por R$ 3.955,69
Garmin Relógio Venu 3 Branco 45mm com Monitor Cardíaco de Pulso e GPS
Vendido por Amazon
Garmin Relógio Venu 3 Branco 45mm com Monitor Cardíaco de Pulso e GPS
De: R$ 4.699,00
Por: R$ 3.099,00
eufy Câmera S3 Pro Kit 2+1 por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Energia Solar, Visão Noturna MaxColor, Reconhecimento Facial por IA, Compatível com Alexa, Sem taxas mensais
Vendido por Amazon
eufy Câmera S3 Pro Kit 2+1 por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Energia Solar, Visão Noturna MaxColor, Reconhecimento Facial por IA, Compatível com Alexa, Sem taxas mensais
De: R$ 3.499,00
Por: R$ 3.324,00
eufy HomeBase3, Câmera de segurança, Reconhecimento Facial por IA, Armazenamento Local Expansível até 16TB, Criptografia Avançada, Ecossistema de Segurança eufy, Sem taxas mensais
Vendido por Amazon
eufy HomeBase3, Câmera de segurança, Reconhecimento Facial por IA, Armazenamento Local Expansível até 16TB, Criptografia Avançada, Ecossistema de Segurança eufy, Sem taxas mensais
De: R$ 849,00
Por: R$ 799,00
Bettdow SmartWatch, Relogio Smartwatch Feminino, 1.27" Ecrã tátil, à prova d'água IP68, 100+ Modos Esportivos, chamada Bluetooth, Compatível com Android iOS, voz por IA (Azul)
Vendido por Amazon
Bettdow SmartWatch, Relogio Smartwatch Feminino, 1.27" Ecrã tátil, à prova d'água IP68, 100+ Modos Esportivos, chamada Bluetooth, Compatível com Android iOS, voz por IA (Azul)
De: R$ 299,00
Por: R$ 241,44
Combo Teclado e Mouse sem fio Logitech POP Icon com Teclas e Botões Personalizáveis, Clique Silencioso, Easy-Switch para até 3 dispositivos e Conexão Bluetooth - Grafite
Vendido por Amazon
Combo Teclado e Mouse sem fio Logitech POP Icon com Teclas e Botões Personalizáveis, Clique Silencioso, Easy-Switch para até 3 dispositivos e Conexão Bluetooth - Grafite
De: R$ 499,90
Por: R$ 388,78
eufy Câmera S330 (eufyCam 3) 2-Cam Kit por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Painel Solar, Forever Power, Reconhecimento Facial IA, Armazenamento Local Até 16TB, Sem Taxa Mensal
Vendido por Amazon
eufy Câmera S330 (eufyCam 3) 2-Cam Kit por anker, Câmera De Segurança Wi-Fi Externa Sem Fio, 4K, Painel Solar, Forever Power, Reconhecimento Facial IA, Armazenamento Local Até 16TB, Sem Taxa Mensal
De: R$ 2.399,00
Por: R$ 2.159,00
soundcore Select 4 Go da Anker, Alto-Falante Bluetooth Portátil, 20H de Bateria, IP67 à Prova d'Água e Poeira, Flutuante, Som Potente, Ideal para Ambientes Internos, Externos e Passeios
Vendido por Amazon
soundcore Select 4 Go da Anker, Alto-Falante Bluetooth Portátil, 20H de Bateria, IP67 à Prova d'Água e Poeira, Flutuante, Som Potente, Ideal para Ambientes Internos, Externos e Passeios
De: R$ 339,00
Por: R$ 188,99
WB Smart Tag Localizador Bluetooth, Rastreador Compatível com o Apple Find My, bateria substituível, Localizador de itens para bolsas
Vendido por Amazon
WB Smart Tag Localizador Bluetooth, Rastreador Compatível com o Apple Find My, bateria substituível, Localizador de itens para bolsas
De: R$ 88,00
Por: R$ 45,00
Anker Nano Carregador Portátil, Power Bank Compacto 10000mAh 45W Máx., Bateria Portátil Essencial para Viagens com Cabo Retrátil InstaCord de 70 cm para iPhone 17/16 Series, iPad, Galaxy, Pixel e Mais
Vendido por Amazon
Anker Nano Carregador Portátil, Power Bank Compacto 10000mAh 45W Máx., Bateria Portátil Essencial para Viagens com Cabo Retrátil InstaCord de 70 cm para iPhone 17/16 Series, iPad, Galaxy, Pixel e Mais
De: R$ 399,00
Por: R$ 379,00
Capa com Teclado Combo Touch para iPad (10ª geração e A16) Com Teclado Retroiluminado Destacável com Suporte, Trackpad Preciso e Tecnologia Smart Connector - Cinza
Vendido por Amazon
Capa com Teclado Combo Touch para iPad (10ª geração e A16) Com Teclado Retroiluminado Destacável com Suporte, Trackpad Preciso e Tecnologia Smart Connector - Cinza
De: R$ 1.629,90
Por: R$ 1.239,90
ULANZI VL-200Bi 200W luz de estúdio bicolor, luz de preenchimento COB, iluminação de saída contínua com controle de APP, 2700K-6500K, 6 cenas, montagem Bowens
Vendido por Amazon
ULANZI VL-200Bi 200W luz de estúdio bicolor, luz de preenchimento COB, iluminação de saída contínua com controle de APP, 2700K-6500K, 6 cenas, montagem Bowens
De: R$ 1.179,00
Por: R$ 943,20
eufy Câmera S350, Camera de Segurança Wi-Fi, 4K Inteligente com Câmera Dupla, Visão 360°, Zoom 8×, Visão Noturna, Babá Eletrônica, Rastreamento por IA, Compatível com Alexa e HomeBase 3
Vendido por Amazon
eufy Câmera S350, Camera de Segurança Wi-Fi, 4K Inteligente com Câmera Dupla, Visão 360°, Zoom 8×, Visão Noturna, Babá Eletrônica, Rastreamento por IA, Compatível com Alexa e HomeBase 3
De: R$ 999,00
Por: R$ 798,99
WAAW By ALOK Fone de Ouvido Bluetooth SENSE 310 Com Cancelamento de Ruído e Assistente de Voz, 30h de Bateria
Vendido por Amazon
WAAW By ALOK Fone de Ouvido Bluetooth SENSE 310 Com Cancelamento de Ruído e Assistente de Voz, 30h de Bateria
De: R$ 329,90
Por: R$ 199,00
WAAW by ALOK Caixa de Som US 200SB DUO Bluetooth 2 em 1, Resistente à Água, Acabamento Metálico, TWS, 20W RMS
Vendido por Amazon
WAAW by ALOK Caixa de Som US 200SB DUO Bluetooth 2 em 1, Resistente à Água, Acabamento Metálico, TWS, 20W RMS
De: R$ 599,90
Por: R$ 476,10
Eufy Cam E340 Câmera De Segurança Wi-Fi Dual Band (2.4/5GHz) Exterior, 360° PTZ, Gravação 24/7, 2000 Lúmens, Detecção de Movimento + Sirene Integrada, Câmera Dupla, Sem Taxa Mensal, Branco
Vendido por Amazon
Eufy Cam E340 Câmera De Segurança Wi-Fi Dual Band (2.4/5GHz) Exterior, 360° PTZ, Gravação 24/7, 2000 Lúmens, Detecção de Movimento + Sirene Integrada, Câmera Dupla, Sem Taxa Mensal, Branco
De: R$ 1.199,00
Por: R$ 1.139,05
Novo Kindle Paperwhite Signature Edition (32 GB) - O Kindle mais rápido já lançado, com luz frontal autoadaptável, carregamento sem fio e bateria que dura semanas - Cor Preta Metálica
Vendido por Amazon
Novo Kindle Paperwhite Signature Edition (32 GB) - O Kindle mais rápido já lançado, com luz frontal autoadaptável, carregamento sem fio e bateria que dura semanas - Cor Preta Metálica
De: R$ 1.199,00
Por: R$ 949,00
Combo Teclado e Mouse Sem Fio Logitech MK250 Bluetooth com Conectividade Rápida e Fácil, Design Compacto, Mouse Ambidestro, Layout ABNT2, Construção Durável, Compatível com PC e Mac - Rosa
Vendido por Amazon
Combo Teclado e Mouse Sem Fio Logitech MK250 Bluetooth com Conectividade Rápida e Fácil, Design Compacto, Mouse Ambidestro, Layout ABNT2, Construção Durável, Compatível com PC e Mac - Rosa
De: R$ 169,90
Por: R$ 155,44
Combo Teclado e Mouse sem fio Logitech MK235 com Conexão USB, Pilhas Inclusas e Layout ABNT2
Vendido por Amazon
Combo Teclado e Mouse sem fio Logitech MK235 com Conexão USB, Pilhas Inclusas e Layout ABNT2
De: R$ 149,90
Por: R$ 119,90
Anker MagGo Power Bank, Carregador Portátil com Certificação Qi2 de 15W, Compatível com MagSafe, 10.000mAh, Tela Inteligente e Suporte Dobrável, para iPhone 17/15/14/13/12, Inclui Cabo USB-C, Branco
Vendido por Amazon
Anker MagGo Power Bank, Carregador Portátil com Certificação Qi2 de 15W, Compatível com MagSafe, 10.000mAh, Tela Inteligente e Suporte Dobrável, para iPhone 17/15/14/13/12, Inclui Cabo USB-C, Branco
De: R$ 699,00
Por: R$ 398,99
Mouse Sem Fio Logitech M330 SILENT com Clique Silencioso, Design Destro, Bateria de 18 Meses, Receptor USB, Compatível com Windows, macOS, ChromeOS e Pilha Inclusa - Preto
Vendido por Amazon
Mouse Sem Fio Logitech M330 SILENT com Clique Silencioso, Design Destro, Bateria de 18 Meses, Receptor USB, Compatível com Windows, macOS, ChromeOS e Pilha Inclusa - Preto
De: R$ 109,90
Por: R$ 79,90
Webcam Full HD Logitech Brio 100 com Microfone Integrado, Proteção de Privacidade, Correção Automática de Luz e Conexão USB-C - Grafite
Vendido por Amazon
Webcam Full HD Logitech Brio 100 com Microfone Integrado, Proteção de Privacidade, Correção Automática de Luz e Conexão USB-C - Grafite
De: R$ 299,90
Por: R$ 222,11

Em um ambiente que eles descrevem como uma “jardim de infância para robôs”, pesquisadores da TRI estão implementando técnicas que prometem eliminar a necessidade de centenas de horas de programação complexa e resolução de erros e bugs.

Leia mais:

A chave para o sucesso desse processo é proporcionar aos robôs um sentido de tato. Ao dotá-los de uma espécie de “polegar macio”, os robôs podem “sentir” o que estão fazendo, o que fornece informações cruciais para a execução de tarefas difíceis que seriam desafiadoras de serem realizadas apenas com base na visão.

É emocionante vê-los interagindo com o ambiente ao seu redor.

Ben Burchfiel, gerente de manipulação habilidosa do Toyota Research Institute

O processo começa com um “professor” humano que demonstra uma série de habilidades aos robôs. Em seguida, ao longo de algumas horas, o modelo de IA aprende essas habilidades em segundo plano. Burchfiel acrescenta que “é comum para nós ensinarmos um robô à tarde, permitir que ele aprenda durante a noite e, na manhã seguinte, nos depararmos com um novo comportamento funcional”.

Os pesquisadores estão empenhados em criar “Grandes Modelos de Comportamento” ou LBCs (Large Behavior Models, em inglês) para os robôs. Esses modelos, semelhantes aos Grandes Modelos de Linguagem, também chamados de LLMs (Large Language Models, em inglês) usados para gerar texto humano, aprenderiam por observação e seriam capazes de realizar novas tarefas que nunca foram explicitamente ensinadas.

Russ Tedrake, professor de robótica do MIT e vice-presidente de pesquisa em robótica da TRI, explica que essa abordagem é revolucionária no campo da robótica. Usando esse processo, os pesquisadores afirmam ter treinado com sucesso mais de 60 habilidades desafiadoras, incluindo “derramar líquidos, usar ferramentas e manipular objetos deformáveis”. Eles têm como meta aumentar esse número para 1.000 até o final de 2024.

É importante notar que outras empresas de tecnologia, como o Google e a Tesla, também estão explorando abordagens semelhantes. Assim como os pesquisadores da Toyota, seus robôs usam a experiência adquirida para inferir como realizar tarefas.

Teoricamente, robôs treinados por IA poderiam, no futuro, executar tarefas com pouca ou nenhuma instrução, semelhante à orientação que se daria a um ser humano (“limpe esse derramamento”, por exemplo).

Principais conquistas

toyota
Imagem: Toyota Research Institute / Divulgação

O Toyota Research Institute descreve as maiores conquistas de seu trabalho para desenvolvimento dos Grandes Modelos de Comportamento como as seguintes:

  • Política de Difusão: TRI e colaboradores no grupo do Professor Song na Universidade de Columbia desenvolveram uma nova abordagem poderosa de aprendizado de comportamento baseada em IA generativa, chamada de “Política de Difusão”, que permite o ensino rápido e fácil de comportamentos por meio de demonstrações.
  • Plataforma de Robô Personalizada: A plataforma de robô do TRI é projetada sob medida para tarefas de manipulação dúctil de braços duplos, com foco especial na capacidade de feedback háptico e sensor tátil.
  • Pipeline: Os robôs do TRI já aprenderam 60 habilidades dúcteis, com uma meta de centenas até o final do ano e 1.000 até o final de 2024.
  • Drake: Parte do “segredo não tão secreto” do instituto de pesquisa da Toyota é o Drake, um design baseado em modelo para robótica que fornece uma ferramenta avançada e uma plataforma de simulação. A alta fidelidade do Drake permite desenvolver em simulação e na realidade em uma escala e velocidade dramaticamente aumentadas. A pilha de robô interna é construída usando as estruturas de otimização e sistemas do Drake. O TRI disponibiliza o Drake como código aberto para estimular o trabalho em toda a comunidade de robótica.
  • Segurança: A segurança é fundamental nos esforços de robótica no TRI. O instituto projetou o sistema com salvaguardas sólidas, alimentadas pelo Drake e pela pilha de controle de robô personalizada, para garantir que os robôs respeitem garantias de segurança, como evitar colisões com eles mesmos ou com o ambiente.

Muito trabalho pela frente

  • No entanto, como observou o The New York Times ao abordar a pesquisa da Google, esse tipo de trabalho costuma ser “lento e trabalhoso”.
  • Fornecer dados de treinamento suficientes é muito mais desafiador do que simplesmente alimentar um modelo de IA com uma grande quantidade de dados da internet.
  • O artigo do NYT destaca um exemplo em que um robô identificou erroneamente a cor de uma banana como sendo branca.
  • Isso ilustra os desafios que ainda enfrentam no desenvolvimento desses sistemas avançados de IA.
  • No entanto, o avanço na capacidade dos robôs de aprenderem por meio da experiência e da observação promete revolucionar a automação de tarefas complexas, tornando-a mais acessível e eficaz do que nunca.
  • A pesquisa da Toyota e de outras empresas nesse campo continua a moldar o futuro da robótica e da inteligência artificial.

Já assistiu aos novos vídeos no YouTube do Olhar Digital? Inscreva-se no canal!

Ana Luiza Figueiredo é repórter do Olhar Digital. Formada em Jornalismo pela Universidade Federal de Uberlândia (UFU), foi Roteirista na Blues Content, criando conteúdos para TV e internet.