Too Long; Didn't Read
- Deepak Pathak discute a necessidade de experiências do mundo físico para a inteligência artificial.
- Ele critica os modelos de linguagem atuais, como o ChatGPT, por carecerem de entendimento sensório-motor.
- O foco é a implementação de aprendizado de reforço adaptativo em robôs.
- Pathak fundou a Skild AI com o objetivo de desenvolver um "cérebro de uso geral" para robôs.
- A integração do entendimento sensorial com modelos de linguagem pode melhorar a capacidade de raciocínio da IA.
Deepak Pathak, professor da Carnegie Mellon University, apresenta uma perspectiva intrigante sobre como a inteligência artificial (IA) pode alcançar níveis humanos de entendimento. Para ele, modelos de IA atuais, como os grandes modelos de linguagem, falham em compreender o mundo físico, uma deficiência que decorre do fato de serem treinados principalmente em dados sem experiências práticas da vida real. Segundo Pathak, para o avanço em direção à inteligência artificial geral (AGI), é essencial que a IA aprenda através de experiências sensório-motoras, similar ao modo como os animais interagem com seus ambientes.
O professor enfatiza a importância de construir um "senso comum sensório-motor" na IA, o que permitirá que as máquinas compreendam e se adaptem aos seus arredores. Essa abordagem não se restringe ao aprendizado baseado em linguagem; em vez disso, Pathak propõe o uso de aprendizado por reforço adaptativo em robôs, que adquirem conhecimento por meio de tentativas e erros. Ele apresenta o método WHIRL, no qual robôs imitam ações humanas para executar tarefas complexas.
Além de suas pesquisas, Pathak, em parceria com um colega, fundou a Skild AI, uma iniciativa que busca desenvolver um "cérebro de uso geral" para robôs, contando com um financiamento substancial para realizar essa visão. A expectativa é que essa nova abordagem permita uma compreensão mais robusta do ambiente pelos robôs, superando limitações observadas em implementações anteriores.
O professor acredita firmemente que, ao combinar entendimento sensorial com modelos de linguagem existentes, seria possível aprimorar significativamente as capacidades de raciocínio da IA. Essa integração não apenas reduziria erros nas saídas da IA, mas também a transformaria em máquinas mais inteligentes e habilitadas para operar de forma eficaz em um vasto leque de cenários do mundo real.