Indo além do Digital

Em aproximadamente 30 anos desde que o primeiro navegador comercial da Internet foi criado, “ser digital” se tornou o mantra para a sobrevivência dos negócios. Os esforços digitais têm proliferado enormemente à medida que as empresas trabalham para acompanhar a inovação tecnológica – e o COVID-19 acelerou enormemente o ritmo.

No entanto, apesar de ter colocado tanta energia e investimento na digitalização, a maioria das empresas não ganhou uma vantagem competitiva. Na verdade, a digitalização pode até ter piorado as coisas, já que as empresas dedicaram cada vez mais seu dinheiro, tempo e energia simplesmente para tentar recuperar o atraso com seus rivais. Ser digital – seja ter um mecanismo sofisticado de e-commerce ou usar um poderoso pacote de gerenciamento de relacionamento com o cliente (CRM) – não é mais suficiente.

Não importa quantas iniciativas digitais você implemente, você não pode esperar construir uma vantagem competitiva real e de longo prazo sendo o mesmo que seus concorrentes ou fazendo o que você sempre fez, mesmo que agora esteja fazendo um pouco mais rápido e mais com mais eficiência do que antes.

Em vez disso, as empresas precisam ir além do digital. As principais empresas fazem isso começando com um grande desafio e, em seguida, construindo a diferenciação (digitalmente) nas capacidades que possuem. Eles obtêm seus recursos diferenciados da maneira certa e, em seguida, o fluxo de produtos, serviços, soluções e experiências movidos a energia digital segue naturalmente. Pense na capacidade de design da Apple, que permitiu que ela perturbasse todos os setores em que entrou. Ou considere a rápida inovação de sabores da Frito-Lay, que permite que ela produza rapidamente novos sabores quando detecta a demanda – por exemplo, um sabor de macarrão com queijo para Cheetos. A tecnologia digital desempenha um papel importante em todos esses recursos – mas esses recursos envolvem muito mais do que tecnologia. Eles exigem combinações dinâmicas de uma base de conhecimento, processos, tecnologias, dados, habilidades, cultura e modelos organizacionais que, juntos, permitem que as empresas criem valor de maneiras que outras não podem.

Então, qual é o melhor caminho a seguir? O livro, Beyond Digital, conduziu, ao longo de mais de dois anos, um esforço de pesquisa em uma dúzia de empresas cujas experiências coletivas contrastam fortemente com aquelas focadas apenas na digitalização. Aprendendo com os sucessos e fracassos dessas dezenas de organizações, identificamos sete imperativos de liderança para ir além do digital e moldar o futuro. Vamos olhar cada um por vez.

1. Reimagine seu lugar no mundo

Para ter sucesso neste novo ambiente, você deve olhar além de seu portfólio atual de negócios e produtos e determinar que valor criará e para quem. Você precisará ser muito mais ambicioso do que poderia imaginar há apenas cinco ou dez anos, graças em parte à evolução de plataformas digitais e ecossistemas poderosos dos quais agora pode participar. Qualquer que seja sua nova proposta de valor, certifique-se de ter identificado uma posição significativa que é exclusiva para você e impulsionada por suas capacidades.

Reconhecer fundamentalmente como você cria valor combina arte e ciência. Observar as tendências de dados e perguntar aos clientes o que eles desejam não é suficiente. Você precisa desenvolver seu próprio ponto de vista único sobre como o valor será avaliado e criado no futuro e quais recursos você precisará para cumprir essa proposição de valor. Seja claro sobre como as decisões de tecnologia apoiam seus recursos, em vez de jogar o jogo de investir em cada solução de tecnologia.

Dez anos atrás, a multinacional Philips sediada em Amsterdã tinha um amplo portfólio de negócios que incluía produtos eletrônicos de áudio e vídeo, iluminação e equipamentos médicos. No entanto, estava aquém das expectativas do mercado. Sob o comando do novo CEO Frans van Houten, a Philips decidiu se reinventar completamente. A empresa se reinventou como uma empresa de tecnologia de saúde, reunindo as amplas percepções e capacidades do consumidor da Philips, sua profundidade em tecnologias de dispositivos médicos e o poder dos dados e inteligência artificial (IA). Como explica Van Houten, “reconheci que as chances de transformarmos a iluminação e a saúde simultaneamente não eram tão grandes. E, então, fizemos uma escolha.”

A missão da Philips além do digital guiou a empresa por uma série de grandes mudanças que revolucionaram seu portfólio, modelo de negócios e cultura. Essas mudanças incluíram a saída de negócios que faziam parte da identidade da empresa – operações de TV, áudio e vídeo; a divisão de iluminação; e eletrodomésticos. Hoje, o foco da Philips como um player de tecnologia de saúde resultou em ganhos notáveis ​​em lucratividade e valor para o acionista, o preço das ações tendo aumentado 82% nos cinco anos encerrados em 2020.

2. Abrace e crie valor por meio dos ecossistemas

Muitos dos problemas de hoje são tão grandes que nenhuma entidade pode resolvê-los por conta própria. Esses problemas podem ser enfrentados apenas por redes de empresas e instituições que trabalham juntas para um propósito comum. Por exemplo, pense sobre a necessidade de mobilidade das pessoas – que requer lidar com métodos de transporte públicos, compartilhados e privados; a infraestrutura; redes 5G públicas; fornecimento de energia; financiamento; regulamento; e muitos outros fatores.

A única maneira de as empresas prosperarem nesta era turbulenta é trabalhar com ecossistemas e aproveitar as capacidades que outros construíram para entregar suas próprias propostas de valor – e fazê-lo com rapidez, escala e flexibilidade.

Quando uma escassez de mão de obra surgiu na indústria de construção do Japão em 2013, a Komatsu tentou resolver o problema introduzindo máquinas de construção ICT (tecnologia da informação e comunicação) que usavam GPS, mapeamento digital, sensores e conexões de internet das coisas para aumentar a eficiência. Mas os líderes perceberam rapidamente que as novas máquinas não estavam resultando no aumento de produtividade esperado. A razão? Gargalos nos processos no canteiro de obras. Em um canteiro de obras de rodovia, por exemplo, a máquina ICT da Komatsu poderia remover e despejar 50% mais sujeira do que uma máquina convencional, mas as empresas de construção não conseguiram programar e contabilizar o número necessário de caminhões basculantes para remover a sujeira do local. Além disso, as construtoras não conseguiram prever com precisão o volume de sujeira que removeriam. Portanto, em 2015, a Komatsu criou uma divisão para focar em soluções amplas, aproveitando as capacidades específicas de uma série de outras empresas e fornecendo uma maneira de conectar digitalmente todas as pessoas e empresas envolvidas nas tarefas de construção e produção. Com tanto agora visível, as empresas em todo o ecossistema poderiam colaborar para aumentar a eficiência e a produtividade. No início de 2017, a Komatsu lançou uma plataforma aberta, Landlog, que tanto fornecedores quanto construtoras poderiam se conectar para tornar os locais mais inteligentes e seguros. Como resultado, para citar apenas um exemplo, os drones podem completar uma pesquisa de um canteiro de obras típico em quatro a seis horas, menos de duas semanas, e o Landlog pode então integrar os dados coletados pelos drones para programar escavadeiras automatizadas. Os clientes relatam serem capazes de concluir o trabalho de construção duas vezes mais rápido do que fariam usando as abordagens tradicionais, economizando dinheiro e reduzindo a pressão sobre os trabalhadores da construção sobrecarregados.

No final de 2020, a Komatsu apresentou sua plataforma orientada ao ecossistema para mais de 10.000 locais de construção no Japão e agora expandiu a proposta para outros países, incluindo Estados Unidos, Reino Unido, Alemanha, França e Dinamarca.

3. Construa um sistema de insights privilegiados com seus clientes

Os clientes sempre foram exigentes. Mas, à medida que os mercados se tornaram mais diversos, dinâmicos e complexos, as expectativas de serviço, consistência e confiança mudaram completamente. Ao mesmo tempo, as oportunidades de coleta, armazenamento e análise de dados explodiram. E a única ferramenta que as empresas utilizam para conhecer seus clientes, a pesquisa de mercado, não está equipada para esse novo mundo.

Como mostra o ecossistema Komatsu, construir um sistema de percepções privilegiadas – percepções que você, exclusivamente, tem sobre seus clientes – requer muito mais do que comprar pesquisas de mercado. Exige que as empresas estabeleçam uma base sólida de propósito e confiança. Afinal, os clientes compartilham suas informações mais úteis e privadas com você, mas apenas se o valor que você oferece em troca repercutir neles e eles confiarem em você para fazer um bom uso de seus dados. Com base nessa base, as empresas podem se concentrar em resolver os problemas mais importantes de seus clientes (por exemplo, ouvindo os clientes em todo o espectro de suas interações). Você pode usar os insights privilegiados obtidos para fortalecer sistematicamente suas propostas de valor, sistemas de recursos e produtos e serviços oferecidos.

Na verdade, obter percepções privilegiadas pode se tornar uma de suas capacidades mais importantes. Quanto melhores forem seus insights, mais você pode aumentar seu valor para os clientes. Quanto mais você melhora suas propostas de valor, mais confiança você gera ao cumprir suas promessas e mais os clientes se envolvem com você. Quanto mais os clientes se envolvem e confiam em você, mais você permanece conectado e relevante para eles – independentemente das mudanças que acontecem no mundo ao seu redor.

Em 2014, a Adobe, empresa de software com sede em San Jose, Califórnia, abandonou a venda de seus aplicativos amplamente usados ​​(como Photoshop, Illustrator e InDesign) como produtos embalados, principalmente como CDs de vendedores terceirizados, e começou a oferecer aplicativos como soluções de software como serviço (SaaS) baseadas em nuvem por meio de assinatura direta. Essa mudança foi apenas o começo. A Adobe reconfigurou seu modelo operacional em torno dos dados recém-disponíveis e percepções do consumidor – e turbinou seus negócios. Antes da mudança, basicamente tudo que a Adobe sabia era quando um cliente registrava um produto. A mudança para o modelo SaaS deu à empresa a capacidade de ver como os clientes estavam usando seus aplicativos em tempo real.

A Adobe então reorientou muito de seu modelo de criação de valor – e estrutura organizacional, como uma próxima etapa lógica – em torno das percepções do cliente. A empresa percebeu que alguns aplicativos negligenciados estavam na verdade gerando um enorme valor para os clientes. Outros insights levaram as equipes a desviar recursos, oferecer novas experiências de integração e fornecer ajuda instantânea. A Adobe foi capaz de detectar que, digamos, um cliente do Photoshop estava ficando frustrado ao editar uma foto e sugeriu um filtro, outra correção ou um tutorial.

Os líderes da Adobe creditam a maior parte do crescimento da receita da empresa, de US$ 5,9 bilhões em 2016 para US$ 12,9 bilhões em 2020, à sua capacidade de insights baseados em dados. E o sucesso da Adobe no início de 2019 a levou a lançar a Adobe Experience Platform, que lhe permitiu vender seu sistema de insights para outras empresas, abrindo um novo fluxo de receita.

4. Torne sua organização orientada para resultados

A criação de valor ampliando alguns recursos de diferenciação requer um novo modelo de trabalho e equipe, dada a gigantesca elevação que alguns desses recursos exigirão à medida que você entrega uma proposta de valor mais ousada. Você não pode se safar tirando as pessoas de suas funções funcionais e pedindo-lhes que trabalhem juntas de 10 a 20% do tempo, ou por seis semanas ou seis meses (na famosa, mas geralmente frustrante equipe multifuncional). Em vez disso, você terá que construir equipes mais duráveis ​​e orientadas para os resultados que reúnam a experiência, o conhecimento, a tecnologia, os dados, os processos e os comportamentos necessários de toda a organização.

Esse tipo de pensamento permitirá que você mude da velha organização funcional e fixa para um modelo de equipes orientadas a resultados que trabalham além das fronteiras organizacionais para fornecer suas capacidades. Essas equipes coexistirão com os escritórios corporativos, unidades de negócios, funções e serviços compartilhados, mas se tornarão cada vez mais elementos proeminentes da organização.

A divisão aeroespacial da Honeywell iniciou sua visão de equipes orientadas a resultados no final da década de 1990, quando os líderes começaram a pensar sobre como os avanços em digitalização, comunicações e conectividade podem criar oportunidades. Seus negócios de aviação fabricavam produtos como motores, freios, equipamentos de navegação e aviônicos. Eles também prestaram serviços como manutenção de aviões e software de informações de vôo. Demorou uma década para que as tecnologias subjacentes alcançassem a visão da Honeywell, mas em 2010 a Honeywell Aerospace estava mapeando como produtos e serviços poderiam ser reunidos como um negócio de “aeronaves conectadas”. O negócio agregaria significativamente mais valor ao cliente do que a soma de suas partes – oferecendo melhor energia e uso de combustível, manutenção preditiva, planejamento de voo mais preciso e informações meteorológicas crowdsourced em tempo real.

A Honeywell percebeu que uma grande reorganização de seus negócios de produtos e serviços de aviação seria necessária para reunir as pessoas, habilidades e capacidades certas. A empresa há muito construía aviões de maneira metódica, com funções que eram segregadas, mas agora precisava construir soluções que cruzavam as fronteiras entre motores, aviônicos e eletrônicos.

Uma mudança organizacional radical trouxe TI, análise de dados e pessoal de engenharia de suas funções domésticas para uma equipe e concedeu autoridade para ampla contratação daqueles com as novas habilidades necessárias. Conforme a transformação estava em andamento, novas equipes foram incumbidas de repensar como as ofertas legadas que existiam como produtos autônomos poderiam ser reinventadas para operar em um ambiente de rede mais amplo.

Hoje, a Honeywell Connected Aircraft é um negócio de US$ 800 milhões e é considerada por muitos analistas como a líder de mercado no espaço de aeronaves conectadas. A plataforma de eficiência de voo Honeywell Forge foi adotada por 128 companhias aéreas e mais de 10.000 aeronaves em todo o mundo em seu primeiro ano no mercado.

5. Inverta o foco da equipe de liderança

Assim como sua empresa precisa de um esforço estratégico para construir as capacidades de diferenciação certas, sua equipe de liderança precisará de novas habilidades e mecanismos para mudar para essa nova forma de criação de valor. Dê um passo para trás e comece a pensar a partir de uma folha em branco: Você tem os papéis certos? Você tem as pessoas certas? Você está se concentrando nas coisas certas? Você está conduzindo a mudança transformacional necessária ou gastando a maior parte do seu tempo respondendo às necessidades de curto prazo da organização? Vocês estão trabalhando juntos de forma eficaz?

Construir capacidades diferenciadas complexas e digitalizadas requer pensamento ousado, forte tomada de decisões e uma energia tremenda. Isso significa que sua equipe de liderança deve liderar de maneira diferente. Não é mais suficiente que sua equipe relate o que está fazendo e forneça seus pontos de vista sobre vários tópicos com base nas necessidades urgentes do momento. A equipe de liderança deve definir uma agenda agressiva e trabalhar em conjunto para realizar grandes coisas.

Quando a Eli Lilly teve problemas no final dos anos 2000, quando a proteção de patentes estava prestes a expirar para quatro medicamentos que representavam 40% da receita da empresa, o CEO John Lechleiter insistiu: “Vamos inovar para solucionar esse problema.” E o fizeram – em grande parte invertendo o foco da gestão.

Como parte de uma mudança no modelo operacional, Lechleiter instituiu mudanças maciças na equipe principal. Até 2009, a equipe de topo era conhecida como Comitê de Política, e nove dos 13 membros representavam funções, enquanto apenas três tinham responsabilidades operacionais. O desequilíbrio parecia ser um sintoma e uma causa de deficiências estratégicas e operacionais. Lechleiter criou um Comitê Executivo recém-nomeado e adicionou os chefes das cinco unidades de negócios à equipe, reduzindo o número de líderes com responsabilidades funcionais para cinco. No geral, oito dos 13 membros do Comitê Executivo eram novos naquela equipe e dois haviam sido contratados de fora. A mistura de experiências dos principais membros da equipe também mudou drasticamente.

A dinâmica mudou completamente”, diz Stephen Fry, chefe de RH. “No antigo comitê, a maioria das pessoas acreditava que seu trabalho era ser o controle e o equilíbrio das pessoas que estavam realmente conduzindo o negócio. O novo comitê tinha uma maioria de pessoas com P&L e responsabilidade operacional, e a discussão na sala tornou-se muito mais voltada para a execução de negócios”.

Em 2016, a Lilly estava firmemente de volta ao caminho do crescimento lucrativo. Nos cinco anos seguintes, o preço das ações triplicou.

6. Reinvente o contrato social com seu pessoal

Envolver os funcionários na execução de uma transformação sempre foi importante, mas hoje está assumindo um significado totalmente novo. Dada a crescente dependência das capacidades que as pessoas ajudam a moldar e o ritmo acelerado das mudanças, a única maneira de ter sucesso é adotar uma “abordagem liderada pelo cidadão” – ter funcionários dentro da organização e do ecossistema contribuindo e inovando continuamente.

Para fazer com que as pessoas saibam para onde a empresa está indo, assegure-as de sua importância na formação do futuro da empresa. Quando as pessoas entenderem seu papel, envolva-as de forma mais significativa. Conectar seu propósito ao propósito da empresa; certifique-se de que eles podem contribuir e fazer parte da solução; oferecer-lhes um senso de comunidade; ajudá-los a desenvolver as habilidades e experiências de que precisam; e dar-lhes o tempo e os recursos necessários para construir as capacidades de diferenciação da empresa.

Um exemplo bem conhecido dessa abordagem é o da FedEx. Desde a sua criação, a FedEx colocou os funcionários no centro das inovações tecnológicas da empresa – e, para a FedEx, tem havido muitas, incluindo a primeira tecnologia de rastreamento em tempo real e o primeiro site a permitir que os clientes rastreiem as encomendas. Os executivos da empresa frequentemente associam a inovação da FedEx à sua filosofia People-Service-Profit (PSP) que remonta à década de 1970 — a ideia de que, se a empresa criar um ambiente de trabalho positivo para os funcionários, os funcionários, por sua vez, fornecerão melhor qualidade de serviço aos clientes, o que fazer com que os clientes queiram usar os produtos e serviços da FedEx, levando à lucratividade.

O elemento mais fundamental dessa filosofia é treinar e desenvolver talentos internos. O programa GOLD (Crescimento, Oportunidade, Liderança e Desenvolvimento) da FedEx, por exemplo, prepara os funcionários para uma possível sucessão na administração e envolve o aproveitamento da experiência e do conhecimento da alta administração, orientando os funcionários da linha de frente e profissionais que desejam gerenciamento. A empresa também oferece programas de treinamento em áreas como blockchain, realidade aumentada e virtual (AR/VR) e design thinking por meio do FedEx Institute of Technology. Além da sala de aula, a FedEx está usando tecnologia como VR para treinar novos contratados para trabalhos em campo, como trabalhos em depósitos – trabalhos que podem ser extenuantes e perigosos.

Há vários anos, a FedEx começou a explorar maneiras de desenvolver a filosofia People-Service-Profit para criar uma cultura que abrace e impulsione a mudança, diz Nik Puri, vice-presidente sênior de TI internacional da FedEx. Este trabalho envolveu enfatizar dois valores centrais: aprender e cuidar. O objetivo era ajudar os funcionários a liderar e se adaptar a qualquer forma de transformação. “A transformação digital está se beneficiando mais” do foco em aprender e cuidar, diz Puri.

A FedEx também está conectando o PSP com outra filosofia de gerenciamento – Quality-Driven Management (QDM), que busca a melhoria contínua, pensamento centrado no cliente, trabalho em equipe e eliminação de desperdícios. Ao reunir os dois programas com inovação de recursos, a empresa viu uma “capacidade exponencial” das equipes para adotar a mudança digital, diz Puri.

O impacto positivo desses movimentos pode ser encontrado na resposta da FedEx durante a pandemia, na qual investimentos em otimização e automação, big data, veículos autônomos e drones se uniram em novos recursos e soluções internas que ajudaram a empresa a atender a uma demanda sem precedentes por entrega de pacotes.

A natureza da criação de valor no mundo além do digital requer capacidades diferenciadas que são complexas e caras – e que dependem de pessoas para construí-las e fornecê-las. Por trás das implementações tecnológicas bem-sucedidas da FedEx estão os recursos criados e fornecidos pelos funcionários da empresa. Não importa quantos investimentos você possa fazer em novas tecnologias e negócios, se você não conseguir que seu pessoal os adote e os integre em seus recursos diferenciados, seus investimentos correm o risco de serem desperdiçados. De fato, quase por unanimidade, os líderes entrevistados durante a pesquisa da PwC disseram que não apenas aprenderam que precisavam se envolver com seu pessoal para ter sucesso em sua transformação, mas também desejaram ter feito muito mais cedo em sua jornada.

7. Interrompa sua própria abordagem de liderança

Apesar da singularidade de cada jornada, observamos um conjunto comum de características entre os líderes que transformaram a empresa, tanto no trabalho com líderes ao redor do mundo quanto em pesquisas para o livro. Essas características também se alinham bem com os seis paradoxos da liderança descritos no livro recente de nosso colega da PwC Blair Sheppard, Ten Years to Midnight.

Em suma, os líderes modernos precisam ser estrategistas e executores, conhecedores de tecnologia e profundamente humanos, hábeis em formar coalizões e fazer concessões enquanto são guiados por sua integridade. Ao mesmo tempo, eles precisam ser humildes e compreender suas limitações. Eles também precisam buscar inovação constantemente, ao mesmo tempo em que se baseiam no que são como empresa. E eles devem ter uma mentalidade global, bem como estar profundamente enraizados em suas comunidades locais.

Embora essas combinações possam parecer uma longa lista de paradoxos, encontramos muitas histórias de executivos que conseguiram conciliá-los. Por exemplo, Howard Schultz, ao retornar à Starbucks como CEO em 2008, mostrou a aparência de um executor estratégico. Mantendo sua visão original da Starbucks como um “terceiro lugar” além do escritório e de casa, Schultz se concentrou nos detalhes – acabando com o uso de sacos de grãos com sabor bloqueado, para que os aromas de café voltassem a encher as lojas enquanto os baristas retiravam os grãos das caixas e aterrá-los; realocar grandes máquinas de café expresso para que os clientes pudessem ver novamente os baristas fazendo bebidas; remover produtos da caixa registradora que, embora gerando receita, prejudicou o que ele viu como a experiência que distinguia a Starbucks de concorrentes como McDonald’s e Dunkin ’Donuts.

Estar ciente das características necessárias o ajudará a ser deliberado sobre seu desenvolvimento e a se cercar de pessoas que irão completar seu perfil de liderança.

Criando um sistema integrado de mudança

Trabalhar em todos os sete imperativos cria um verdadeiro sistema de interligação que tornará sua empresa adequada para os desafios que virão à medida que o mundo vai além do digital. Considere o que acontecerá se você negligenciar um deles. Quando você não tem certeza sobre o lugar da sua empresa no mundo, por exemplo, não terá um propósito claro que está enraizado em como você cria valor para os clientes. Você não terá uma estrela do norte para tomar decisões sobre quem está em seu ecossistema e como você deve fazer parceria com eles. Quando você não constrói um sistema de insights privilegiados com os clientes, não entende como seus desejos e necessidades evoluem – ou como você deve evoluir com eles. Quando você não torna sua organização orientada para resultados, seu pessoal terá dificuldade em trabalhar em silos e se esforçará para construir recursos multifuncionais diferenciados.

No entanto, abraçar qualquer um desses imperativos ajuda seus esforços nos outros. Trabalhar em um ecossistema, por exemplo, permite que você obtenha insights mais profundos sobre mais clientes de mais ângulos. Você também pode combinar forças com parceiros do ecossistema, oferecer maior valor aos clientes e ocupar um lugar mais ambicioso no mundo. E você fortalece as capacidades de sua equipe de liderança, dando-lhes a chance de ver intimamente como outras empresas funcionam. Em um espírito semelhante, reinventar o contrato social com seu pessoal e envolvê-los de forma significativa permite que contribuam para moldar para onde sua empresa está indo e como ela chegará lá.

Mas esses desafios não devem ser usados ​​como desculpas para se manter os modelos de negócios atuais. Sem uma transformação de negócios mais fundamental, a digitalização é um caminho para lugar nenhum. Embora seja fácil digitalizar e alcançar os concorrentes, suas partes interessadas – acionistas, clientes e funcionários – exigem muito mais. Como Peter Drucker disse, “a administração está fazendo certo as coisas; liderança é fazer as coisas certas”. Agora é a hora de as equipes executivas se apresentarem, se romperem e se tornarem líderes na era digital.

O imperativo de dados e tecnologia

Conforme você vai além do digital, precisará certificar-se de abordar os dados e a tecnologia subjacentes necessários para oferecer suporte a seus recursos de diferenciação. Seus recursos de diferenciação precisarão ser alimentados por insights privilegiados, que, por sua vez, precisarão ser alimentados por dados, e esses dados precisarão ser suportados pela tecnologia certa para capturá-los e criar novos insights. Resumindo, você lutará para ter sucesso com a diferenciação baseada em recursos, sem uma estratégia de dados e tecnologia que ofereça suporte. Muitas empresas sofrem com os investimentos em dados e tecnologia que são isolados por função ou negócio e não estão claramente conectados à estratégia de criação de valor da empresa. Para ir além do digital, você precisará priorizar sua estratégia de dados e tecnologia e ser capaz de demonstrar de forma clara e tangível como isso possibilita diretamente o lugar de sua empresa no mundo e seu plano de criação e preservação de valor.

A tecnologia que ajuda as empresas a capturar dados e transformá-los em percepções existe e continua a ser inovada rapidamente. Soluções de planejamento de recursos empresariais (ERP) baseadas em nuvem, armazenamento sob demanda, sensores conectados, aprendizado de máquina e ferramentas de IA e muitas outras tecnologias projetadas para coletar, processar e analisar dados de forma rápida, flexível e criativa em abundância. O desafio geralmente é fazer escolhas entre a abundância de opções e sequenciar essas escolhas de forma que se reforcem mutuamente e levem a um impacto mensurável.

Ao considerar como moldar sua agenda de tecnologia e dados, oferecemos algumas perguntas que podem ajudá-lo a priorizar o que é certo para sua empresa:

  • O investimento em tecnologia está contribuindo para o cerne de suas capacidades de diferenciação ou está atendendo a outras necessidades?
  • O investimento está apoiando você na construção de amanhã ou garantindo o hoje? Qual será o impacto do investimento no lugar da sua empresa no mundo?
  • Você pode medir e quantificar com clareza e honestidade o impacto nos negócios em termos de criação ou preservação de valor? O investimento se compensa de forma mensurável ou é baseado em premissas que podem ser validadas apenas no futuro? (Observação: se o investimento não puder se pagar comprovadamente e for baseado em suposições que você não pode validar hoje, é muito provável que não seja granular o suficiente e nem planejado bem o suficiente para ser aprovado).
  • Você pode adquirir e reter o talento crítico para desenvolver essa tecnologia e torná-la relevante para o seu negócio? É essencial para suas capacidades de diferenciação construir a base de talentos dentro de sua organização?
  • A capacidade de tecnologia de que você precisa já existe em algum lugar em seu ecossistema ou no mercado fornecedor mais amplo? Você pode aproveitar isso ao mesmo tempo em que protege suas capacidades de diferenciação e não coloca sua vantagem competitiva em risco?
  • Você pode construir parcerias e relacionamentos confiáveis ​​para executar com um equilíbrio entre velocidade e eficiência?
  • Todas as partes interessadas que precisam mudar para perceber o valor de seus investimentos em tecnologia estão comprometidas com isso? Eles podem ser responsabilizados? Você tem o modelo de governança em vigor para garantir e fazer cumprir a responsabilidade individual e colaborativa?
  • A sua organização e cultura estão prontas para a mudança? Você pode garantir que seu pessoal possa incorporar a tecnologia que você constrói?

Esta é uma lista inicial e certamente não exaustiva. No entanto, trabalhar essas questões pode ajudá-lo a abordar os fatores essenciais de sucesso necessários para moldar a estratégia de dados e tecnologia que apoiará sua visão além da digital.

Se gostou, por favor, compartilhe.

Conte comigo em seus projetos. Sobre mim: aqui. Contato: aqui.

Um abraço, @neigrando

Referência

Texto traduzido e adaptado com base no artigo original em inglês da PwC Strategy& “Seven imperatives for moving beyond digital”, by Paul Leinwand e Mahadeva Matt Mani (2021)

Artigos relacionados

Composição em Negócios Digitais

Arquitetura de negócios alinhada a agilidade de negócios somada aos blocos de construção que podem ser disponibilizados pela tecnologia da informação pode fazer toda a diferença nos dias atuais. Contando que a TI utilize em seu desenvolvimento e operações (devops) design orientado por domínio e arquitetura limpa em microservices. Recentemente recebi um material do Gartner que enfatiza tal arquitetura em negócios digitais com uma visão de composição de blocos de construção a qual procurei traduzir com uma leve adaptação, como segue.

Incorporar a capacidade de composição em negócios digitais permite que a empresa ou agência pública mude e cresça apesar da incerteza persistente. Em vez de evitar o risco de mudança, os líderes executivos devem reinventar seu pensamento para ver a mudança como uma ferramenta confiável para a resiliência e o crescimento dos negócios.

Oportunidades e Desafios

  • Em tempos de turbulência, todos os negócios estão em uma encruzilhada: Impulsione a mudança ou imponha a mudança a você. A diferença nos resultados pode ser grande.
  • A disrupção desafia as convenções de negócios. Líderes visionários usam isso como uma oportunidade para reinventar seu pensamento de negócios e crescer através da turbulência.
  • Reinventar o pensamento empresarial é o início de uma nova liderança; ela forma a base cultural estratégica para muitas decisões futuras.
  • O risco de mudança é amplificado por projetos e práticas de negócios arraigados.

Dominar a mudança aumenta as opções de liderança e reduz as barreiras para alcançar valor inexplorado desencadeado pela disrupção.

O que você precisa saber

  • Apenas reforçar a estabilidade em um mundo turbulento é uma estratégia perdedora.
  • O pensamento de composição reconhece a oportunidade onde os outros veem apenas o risco de mudança. Os líderes executivos usam os princípios fundamentais da composição para acelerar seus negócios e prosperar em um ambiente novo e mais turbulento.
  • Os designs de negócios compostos preparam os líderes para tomar decisões que seriam muito arriscadas sem a arquitetura da composição.
  • Composable thinking e composable architecture só podem ter sucesso juntos. Um investimento em arquitetura sem clareza da missão não entregará a experiência transformadora do negócio digital composto.

Premissas de Planejamento Estratégico

Até 2024, 20% dos CEOs do Global 2000 relatarão um maior apetite por risco e maior resiliência, ambos atribuídos ao redesenho modular dos negócios.

Até 2024, o mantra para o novo SaaS será “composable API-first e API-only”, relegando os fornecedores tradicionais de SaaS como “legado”.

Insights dos Especialistas

Composable Thinking supera a incerteza nos negócios

Preparar-se para a mudança é um seguro para a viabilidade futura do negócio. E, como acontece com todos os seguros, os custos podem parecer muito altos… até que seja necessário, quando provar ter sido uma pechincha.

A capacidade de composição torna a mudança mais fácil, rápida, segura e, portanto, menos dispendiosa. É um modelo que vale o investimento para aqueles que esperam que a demanda por mudanças continue aumentando.

Estar preparado para a mudança é um imperativo estratégico em tempos turbulentos. A preparação para a mudança permite um comportamento proativo e reativo. As organizações se beneficiarão de dominar a mudança na medida em que lhes permita iniciá-la em busca de uma oportunidade, não apenas ficar parado até que eventos externos imponham a necessidade de mudança.

Para se ajustar e florescer diante da incerteza e da oportunidade, os líderes devem começar a reinventar seu pensamento de negócios. A composição começa com uma mudança de mentalidade da mudança é uma ameaça à mudança é uma ferramenta poderosa e familiar. O valor inexplorado vem de abraçar e dominar a mudança.

O maior perigo em tempos de turbulência não é a turbulência; é agir com a lógica de ontem.” – Peter Drucker

Composable thinking, composable business architecture e composable technology são os três pilares do composable digital business. Os líderes nas indústrias onde a mudança é mais urgente, como comércio, manufatura e saúde, estão praticando hoje.

Em vez de apenas acompanhar o ritmo, os líderes definem o ritmo. As organizações líderes marcarão a década de 2020 como a era em que reinventaram seu pensamento de negócios para abraçar as mudanças e acelerar sua transição para os negócios digitais, aplicando os princípios fundamentais da composição.

Visão Geral

Definição: Um negócio digital composto aplica os princípios fundamentais de composição (modularidade, autonomia, orquestração e descoberta) aos fundamentos de sua arquitetura de negócios (o modelo de negócios, operações e estratégia da empresa) para dominar o risco de mudança e alcançar valor comercial inexplorado.

A Figura 1 apresenta os princípios básicos de design para composição. Use-os para enquadrar a estratégia de modularização e regras de composição para seu contexto específico, como:

  • Cadeias de suprimentos recompostas dinamicamente usando o cadastro de fornecedores pré-aprovados.
  • Equipes de projetos ad hoc compostas de forma personalizada por um grupo de indivíduos com diversas habilidades e experiências.
  • Aplicativos personalizados compostos por componentes de software provenientes de mercados de API de negócios.

As primeiras áreas a modernizar para a composição são as áreas da arquitetura de negócios e tecnologia da organização onde a preparação para a mudança é mais urgente. Uma abordagem de cima para baixo ou de baixo para cima pode funcionar, dependendo da cultura de liderança da organização:

  • De cima para baixo – começa com o pensamento composto no nível de liderança executiva da organização. O pensamento composto promove o uso criativo dos princípios de design em toda a organização. Diferentes segmentos subordinados da organização aplicam o pensamento composto em seus próprios contextos e repetem a abordagem de cima para baixo em seu próprio domínio.
  • De baixo para cima – começa com a aplicação dos princípios de design de composição à tecnologia dentro da organização e, em seguida, promovendo os princípios do pensamento composto em toda a organização para acelerar os efeitos comerciais dos investimentos iniciais em tecnologia. À medida que os líderes de tecnologia incentivam seus colegas de negócios a pensarem em composição, eles começam a aplicar seus princípios à arquitetura de negócios e às estratégias de liderança executiva.

Em ambos os casos, o investimento inicial em inovação pode ser pequeno e a modernização da arquitetura de negócios e da base tecnológica pode ser gradual. Mesmo um investimento limitado, quando combinado com o pensamento composto, proporcionará uma melhoria notável na resiliência, adaptabilidade e prontidão para mudar. As primeiras histórias de sucesso ajudarão a desencadear a transformação e levar a organização a reinventar seu pensamento de negócios. Essas histórias incentivam as organizações a dominar o risco da mudança e a buscar a mudança como motor do crescimento dos negócios.

Destaques da Pesquisa

Comece com o pensamento composto

A jornada para negócios combináveis ​​começa com líderes e tomadores de decisão adotando uma nova maneira de pensar – a semente da mudança cultural que se manifesta em um novo caráter de estratégias de negócios emergentes (veja a Figura 2):

  • Tudo é visto como modular e mutável; a mudança é vista como uma ferramenta essencial, não mais como uma ameaça ou um fardo.
  • “Não conserte o que não está quebrado” está fora. Tudo o que não é mutável é uma “dívida” comercial ou técnica, uma barreira à vitalidade da organização que enfrenta turbulência e incerteza.
  • Tudo é projetado para mudar, e a mudança é frequentemente considerada para alcançar resultados grandes e pequenos, visando tanto o crescimento quanto a resiliência.
  • Mais mudanças são introduzidas, impulsionadas e antecipadas pelo negócio; menos lhe é imposto.
  • A nova maneira de pensar, aplicada a pessoas, sistemas, processos e arquitetura de negócios de maneira semelhante, forma uma nova cultura generalizada e fomenta novos comportamentos.
  • Um novo equilíbrio entre estabilidade (comportamento repetível) e agilidade (comportamento alterado) surge por meio da composição, à medida que a liderança empresarial ganha o controle do risco de ambos.

Tudo é planejado com uma arquitetura modular; autonomia, orquestração e descoberta dos módulos são os princípios de design e as proteções para a qualidade dos resultados. Ao particionar a arquitetura de negócios em componentes modulares que podem ser alterados um de cada vez e de forma autônoma, a capacidade de composição prepara a organização para uma mudança mais rápida, eficiente e segura.

Há duas razões pelas quais os líderes de negócios normalmente recorrem à composição:

  • Defesa: Alguns podem ter perdido uma oportunidade de negócios porque não conseguiram fazer a mudança necessária. Ou eles não conseguiram se ajustar a tempo a um evento comercial ou de segurança cibernética que interrompeu seus negócios. Eles podem ter tido essas experiências, ou podem estar antecipando-as. Aprender a mudar com mais rapidez e segurança é uma boa defesa contra a disrupção, e a capacidade de composição é o meio para esse fim.
  • Ataque: os outros não esperam oportunidades; procuram criá-las. Eles visam o potencial inexplorado que emerge quando dominam maiores graus de risco. O risco de mudança não pode ser eliminado, mas a modularidade pode ser uma ferramenta para mitigar o aumento dos riscos de mudança estratégica.

À medida que a organização exerce com sucesso o pensamento composto, a prevalência precoce da motivação defensiva dá lugar à mentalidade de crescimento e ao objetivo de resultados mais competitivos e superiores.

Aplique a composição para acelerar o seu negócio digital

Aplicar a composição para acelerar seu negócio digital permite que os líderes executivos planejem mudanças de negócios mais significativas com mais frequência e acompanhem melhor as necessidades em constante mudança de clientes ou constituintes.

Até mesmo os processos de negócios digitalizados são desafiados a acompanhar o ritmo do novo pensamento de negócios. Em um negócio digital, os mundos físico e digital são fundidos. Não mais independentes, eles sobem e descem juntos. Para enfrentar esse desafio existencial, organizações de todos os setores estão se voltando para os princípios básicos de design de composição e aplicando-os ao seu modelo de negócios, operações de negócios empresariais e suas estratégias (veja a Figura 3).

Um negócio composto transforma estratégias, processos, estruturas organizacionais e as formas como as pessoas trabalham de fixas e planejadas para o longo prazo, para flexíveis e continuamente revisadas. As políticas não são mais imóveis; elas são ativamente atualizadas, substituídas ou retiradas. A segurança e a integridade das operações se tornam mais hábeis à medida que os recursos de negócios endereçáveis (e protegíveis) são mais refinados para suportar os princípios de modularidade combináveis.

Hoje, os setores onde a mudança é mais urgente, como saúde, varejo e finanças, são os que mais investem em pensamento composto aplicado a seus aplicativos, soluções e iniciativas.

Priorize a composição em sua arquitetura de aplicativos

Embora após 25 anos de arquitetura orientada a serviços, modularidade seja um conceito familiar para arquitetos de aplicativos, a transição para a modularidade no projeto de software composto ainda apresenta desafios. A principal causa das dificuldades é que a modularidade agora precisa atender a um novo público – os novos “compositores” multidisciplinares e democratizados que trabalham em equipes de fusão. Essa democratização da entrega e alavancagem da tecnologia requer uma nova organização, novos processos e um novo pensamento.

O foco nas equipes de fusão de TI e negócios muda a modularidade de aplicativos de APIs técnicas para recursos de negócios (e produtos de API). Essa mudança cria novas oportunidades para reutilização criativa. Uma capacidade de negócios autônoma claramente definida, com um valor comercial claro, tem muito mais probabilidade de ser reutilizada para novos projetos de negócios do que as APIs técnicas de microservices.

Nem os profissionais de negócios nem os profissionais de TI podem acompanhar sozinhos o ritmo acelerado das mudanças nos negócios. Muitas organizações formam equipes de fusão para reunir seus conhecimentos de negócios e tecnologia para recursos, produtos e decisões de negócios habilitados para tecnologia mais rápidos e melhores.

A arquitetura de composição ajuda as organizações a distribuir responsabilidades de uma forma que traz negócios e tecnologia em um continuum orgânico (veja a Figura 4).

  • Os criadores implementam a modularidade composta encapsulando os recursos de negócios em blocos de construção de software empacotados e, em seguida, registrando-os no catálogo/mercado central. Geralmente, são provedores de aplicativos ou TI interna que usam ferramentas profissionais de engenharia de software e/ou ferramentas avançadas de baixo código.
  • Os curadores gerenciam o catálogo/mercado através da implementação de políticas e padrões para garantir um nível seguro de qualidade e integridade para o processo de composição.
  • Os compositores criam os aplicativos que podem ser compostos usando os blocos de construção registrados, desenvolvendo e integrando novos processos e interfaces de usuário para fornecer experiências de aplicativos aos usuários finais. Geralmente, são equipes de fusão usando ferramentas e técnicas democratizadas de criação de aplicativos.
  • Os consumidores usam os aplicativos compostos para perseguir seus objetivos de negócios, fazer alguns ajustes limitados e trabalhar com os Compositores para manter suas experiências digitais sempre atualizadas.

Os papéis do Criador, Curador, Compositor e Consumidor não são necessariamente mapeados para uma estrutura organizacional: alguns indivíduos podem desempenhar vários papéis e cumprir várias responsabilidades. Por exemplo, Consumidores também podem ser Compositores e Compositores também podem ser Criadores. No entanto, as responsabilidades de cada função permanecem distintas.

A arquitetura de tecnologia composta é uma base para a capacitação digital dos negócios.

Conte comigo em seus projetos. Sobre mim: aqui. Contato: aqui.

Se gostou, por favor, compartilhe.

Um abraço, @neigrando

Referência

Traduzido e adaptado de “Becoming Composable: A Gartner Trend Insight”, by Yefim Natis,Janelle Hill, Partha Iyengar, Gene Alvarez, Jennifer Loveland, Chris Howard.

Artigos relacionados

A Essência do Aprendizado de Máquina

O objetivo deste artigo é apresentar resumidamente uma introdução a alguns dos componentes mais importantes da inteligência artificial, sob o ponto de vista técnico, porém voltado a lideres e gestores negócios e iniciantes no tema, considerando: o aprendizado de máquina (machine learning), a aprendizagem profunda (deep learning) e a aprendizagem por reforço (reinforcement learning).

Uma visão geral sobre o tema pode ser visualizada com este primeiro diagrama que mostra a Relação entre a Inteligência Artificial, Aprendizado de Máquina e Aprendizagem Profunda:

Arthur Samuel descreveu-o em 1959 como: “o campo de estudo que dá aos computadores a capacidade de aprender sem serem explicitamente programados”.  Esta é uma definição mais antiga e informal.

Tom Mitchell fornece uma definição mais moderna: “Diz-se que um programa de computador aprende com a experiência E em relação a alguma classe de tarefas T e medida de desempenho P, se seu desempenho em tarefas em T, medido por P, melhora com a experiência E.”

Esse diagrama simplificado apresenta a diferença básica entre a Programação Clássica de computadores versus a Aprendizagem de Máquina, como segue:

A seguir serão apresentados alguns diagramas simplificados (em inglês), obtidos do post “Machine Learning for Everyone“, com uma breve explicação (traduzida para o português).

Vale lembrar que o aprendizado de máquina depende essencialmente de três elementos: 1) Dados – com quantidade maior possível e qualidade o melhor de dados possível, relacionados ao problema que se deseja resolver; 2) Algoritmos – com o algoritmo ou conjunto deles, apropriado(s) para resolver o problema desejado; e 3) Parâmetros – usados no ajuste do tratamento dos dados.

Estes três elementos servirão durante o desenvolvimento para gerar um determinado Modelo de aprendizado que será utilizado para obter soluções a partir de novos dados em testes ou produção. Em alguns casos podem ser necessários ajustes nos parâmetros, mais e/ou melhores dados, ou até mesmo a troca do algoritmo por outro obtenha melhor precisão de resultados.

Os principais tipos de aprendizagem de máquina

É importante destacar que não há uma única maneira de resolver um problema no mundo da aprendizagem de máquinas, pois existem vários algoritmos adequados ao problema, assim precisa-se escolher qual deles se encaixa melhor. Quase tudo pode ser resolvido com uma rede neural, por exemplo, mas nem sempre é a melhor solução, principalmente devido ao custo computacional.

Seguem quatro direções principais no aprendizado de máquina.

1 – Aprendizado de máquina clássico

Os primeiros métodos vieram da estatística pura nos anos 50. Eles resolviam tarefas matemáticas formais – procurando padrões em números, avaliando a proximidade dos pontos de dados e calculando as direções dos vetores.

Hoje em dia, metade da Internet funciona baseada nestes algoritmos. Quando se vê uma lista de artigos para “ler em seguida” ou o banco bloqueia o cartão de alguém em um posto de gasolina aleatório no meio do nada, provavelmente é o trabalho de um algoritmo de machine learning.

Empresas de tecnologia são grandes fãs de redes neurais, obviamente. Para elas, uma precisão de 2% é uma receita adicional de 2 bilhões. Mas quando você é pequeno, não faz sentido tanto esforço.

Há histórias de equipes gastando um ano em um novo algoritmo de recomendação para o site de comércio eletrônico, antes de descobrir que 99% do tráfego vem de mecanismos de pesquisa. Seus algoritmos eram inúteis. A maioria dos usuários nem abriu a página principal.

Apesar da popularidade, as abordagens clássicas são tão naturais que você poderia facilmente explicá-las a uma criança. Elas são como aritmética básica, as usamos todos os dias, sem sequer pensar.

O aprendizado de máquina clássico é frequentemente dividido em duas categorias – Aprendizado SupervisionadoNão Supervisionado.

1.1 – Aprendizado Supervisionado

Nesse primeiro caso, a máquina tem um “supervisor” ou um “professor”, que dá à máquina todas as respostas, como por exemplo para identificar se é um gato ou um cachorro em uma foto. Neste caso, o “professor” já dividiu (rotulou) os dados em gatos e cães e a máquina está usando esses exemplos para aprender.

Aprendizado não supervisionado significa que a máquina é deixada sozinha com uma pilha de fotos de animais e uma tarefa: descobrir quem é quem. Os dados não são rotulados, não há professor e a máquina está tentando encontrar padrões por conta própria. Vamos falar sobre esses métodos abaixo.

Claramente, a máquina aprenderá mais rápido com um professor. Por isso, é mais comum encontrarmos esse caso nas tarefas da vida real.

Existem dois tipos de tarefas: classificação – predição de categoria de um objeto e previsão de regressão – de um ponto específico em um eixo numérico.

1.1.1 – Classificação

Os algoritmos de classificação dividem os objetos com base em um dos atributos conhecidos de antemão. Separa as meias com base na cor, documentos baseados na linguagem e as músicas por gênero.

Usada nos dias de hoje para:

  • Filtragem de spam;
  • Detecção de idioma;
  • Pesquisa por documentos semelhantes;
  • Análise de sentimentos;
  • Reconhecimento de caracteres e números manuscritos;
  • Detecção de fraude.

Algoritmos populares: Naive BayesDecision TreeLogistic RegressionK-Nearest NeighboursSupport Vector Machine.

Aprendizado de máquina é, principalmente, uma tarefa de classificar as coisas. A máquina aqui é como um bebê aprendendo a classificar brinquedos: aqui está um robô, aqui está um carro, aqui está um carro robô etc.

Na classificação, precisa-se sempre de um “professor”. Os dados devem ser rotulados com as características para que a máquina possa atribuir classes com base nelas. Tudo poderia ser classificado – usuários por interesses (como os feeds algorítmicos), artigos baseados em linguagem ou tópicos (isso é importante para os mecanismos de busca), músicas por gênero (playlists do Spotify), até seus e-mails.

Na filtragem de spam, o algoritmo Naive Bayes é amplamente usado. A máquina conta o número de menções “viagra” no spam e nas mensagens normais, depois multiplica as duas probabilidades usando a equação de Bayes, soma os resultados e Voilá, temos Aprendizado de Máquina.

Entretanto, mais tarde, os spammers aprenderam a lidar com filtros bayesianos adicionando muitas palavras “boas” ao final do e-mail. Ironicamente, o método foi chamado de envenenamento bayesiano.

Naive Bayes entrou para a história como o mais elegante e o primeiro algoritmo realmente útil para essa tarefa. Mas agora outros algoritmos são usados para filtragem de spam.

Outro exemplo prático de classificação, digamos que precisa-se de algum dinheiro a crédito. Como o banco saberá se será pago de volta ou não? Não há como saber com certeza. Mas o banco tem muitos perfis de pessoas das quais recebeu dinheiro antes. Eles têm dados sobre idade, educação, ocupação, salário e – o mais importante – o fato de pagar o dinheiro de volta. Ou não.

Usando esses dados, podemos ensinar a máquina a encontrar padrões e obter a resposta. Entretanto, o banco não pode confiar cegamente na resposta da máquina.

E se houver uma falha no sistema ou ataque hacker?

Para lidar com isso, temos as árvores de decisão. Todos os dados são automaticamente divididos em perguntas de sim ou não, que alias poderiam soar um pouco estranhas do ponto de vista humano.
Um exemplo de pergunta estranha seria se o credor possui uma renda mensal maior que R$ 1280,50. No entanto, a máquina faz essas perguntas para dividir melhor os dados em cada etapa.

É desse modo que uma árvore de decisão é feita: quanto maior o ramo – mais ampla é a questão. Árvores de decisão são amplamente usadas em esferas de alta responsabilidade: diagnósticos, medicina e finanças.

Árvores de decisão puras raramente são usadas hoje. No entanto, elas frequentemente estabelecem a base para grandes sistemas e seus conjuntos até funcionam melhor que redes neurais.

Já o Support Vector Machine (SVM) é o método mais popular de classificação clássica. Foi usado para classificar tudo o que existe: plantas por aparência em fotos, documentos por categorias, etc.

A ideia por trás do SVM é simples – ele tenta desenhar duas linhas entre seus pontos de dados com a maior margem entre eles. Veja a imagem abaixo:

Os mercados de ações utilizam SVM para detectar um eventual comportamento anormal dos comerciantes para encontrar os insiders. Ao ensinar um computador as coisas certas, nós automaticamente ensinamos quais são as coisas que estão erradas.

Atualmente, as redes neurais são mais frequentemente usadas para classificação.
Alias, é para isso que elas foram criadas…

A regra geral é quanto mais complexos os dados, mais complexo é o algoritmo. Para textos, números e tabelas, pode-se escolher a abordagem clássica. Os modelos são menores lá, eles aprendem mais rápido e trabalham com mais clareza. Para fotos, vídeos e todas as outras coisas complicadas de Big Data, costuma-se definitivamente optar por redes neurais.

Há apenas cinco anos, você poderia encontrar um classificador de faces construído em SVM. Hoje é mais fácil escolher entre centenas de redes pré-treinadas (modelos). Nada mudou para filtros de spam, no entanto. Muitos ainda são escritos com o SVM e não há uma boa razão para mudar.
Até mesmo este site possui detecção de spam baseada em SVM nos comentários ¯_ (ツ) _ / ¯

1.1.2 – Regressão

“Desenhe uma linha através desses pontos. Sim, isso é o aprendizado de máquina”.

Usada nos dias de hoje para:

  • Previsões do preço das ações;
  • Análise de demanda e volume de vendas;
  • Diagnóstico médico;
  • Quaisquer correlações numéricas.

Algoritmos populares: Regressão LinearRegressão Polinomial.

Regressão é basicamente uma classificação em que prevemos um número em vez de uma categoria. Exemplos disso são a previsão do preço de um carro pela sua quilometragem, tráfego por hora do dia, volume de demanda por crescimento da empresa, etc. A regressão é perfeita quando algo depende do tempo.

Todo mundo que trabalha com finanças e análises adora a regressão. Inclusive é embutida no Excel. E é super leve computacionalmente – a máquina simplesmente tenta desenhar uma linha que indica correlação média. Embora, ao contrário de uma pessoa com uma caneta e um quadro branco, a máquina faz isso com precisão matemática, calculando o intervalo médio entre cada ponto.

Quando a linha resultante é reta – é uma regressão linear, quando é curva – polinomial. Esses são os dois tipos principais de regressão. Os outros são mais exóticos. A regressão logística é uma exceção, pois não é uma regressão, mas sim um método de classificação. Fique atento!

Não há problema em trabalhar com regressão e classificação, no entanto muitos classificadores se transformam em regressão após algum ajuste. Podemos não apenas definir a classe do objeto, mas também memorizar o quão próximo ele está. Aí começa a regressão.

1.2 – Aprendizado não supervisionado

O aprendizado não supervisionado foi inventado um pouco mais tarde, nos anos 90. É usado com menos frequência, mas às vezes simplesmente não temos escolha.
Os dados rotulados são um luxo. Mas e se alguém quiser criar, digamos, um classificador de ônibus? Deve-se tirar fotos manualmente de milhões de ônibus nas ruas e rotular cada um deles? De jeito nenhum! Isso vai levar uma vida inteira.

Neste caso, ou você recorre ao Mechanical Turk, ou você pode tentar usar o aprendizado não supervisionado.

Geralmente é útil para análise exploratória de dados, mas não como algoritmo principal. Pessoas “especialmente treinadas”, graduadas em “Oxford”, alimentam a máquina com uma tonelada de “lixo” e a observa. Existem alguns clusters? Não. Quaisquer relações visíveis? Não.

1.2.1 – Agrupamento

Usada nos dias de hoje para:

  • Segmentação de mercado (tipos de clientes, fidelidade);
  • Mesclar pontos próximos em um mapa;
  • Compressão de imagem;
  • Analisar e rotular novos dados;
  • Detectar um comportamento anormal.

Algoritmos populares: K-means_clusteringMean-ShiftDBSCAN.
Clusterização ou agrupamento (clustering), é uma classificação sem classes predefinidas. É como dividir meias por cor quando você não se lembra de todas as cores que você tem.

O algoritmo de clusterização tenta encontrar objetos semelhantes (por características) e mesclá-los em um grupo (cluster). Aqueles que têm muitas características semelhantes são unidos em uma classe. Com alguns algoritmos, você ainda pode especificar o número exato de clusters que você deseja.

Um excelente exemplo de clusterização são marcadores em mapas da web. Quando você está procurando por todos os restaurantes ao seu redor para escolher a melhor opção para o almoço, o mecanismo de agrupamento agrupa-os em bolhas com um número.

O Apple Photos e o Google Photos usam clusters mais complexos. Eles procuram rostos em fotos para criar álbuns de seus amigos. O aplicativo não sabe quantos amigos você tem e como eles se parecem, mas busca encontrar características faciais comuns. É um agrupamento típico.

Outro problema popular é a compactação de imagens. Ao salvar uma imagem em PNG, você pode definir a paleta, digamos, para 32 cores. Isso significa que o agrupamento encontrará todos os pixels “avermelhados”, calculará o “vermelho médio” e o definirá para todos os pixels vermelhos. Quanto menor o número de cores – menor será o tamanho dos arquivos e menor será o custo!

No entanto, você pode ter problemas com cores do tipo Ciano. Ela é verde ou azul? Aqui entra o algoritmo K-Means.

O K-Means define aleatoriamente 32 pontos de cor na paleta, que são definidos como centroides. Os pontos restantes são marcados como atribuídos ao centroide mais próximo.

Assim, temos tipos de “galáxias” em torno dessas 32 cores. Então, movemos o centroide para o centro de sua galáxia e repetimos o processo até que os centroides parem de se mover.

Tudo pronto! Clusters estão definidos, estáveis e existem exatamente 32 deles. Aqui está uma explicação mais real:

Procurar pelos centroides é conveniente em muitos casos. Entretanto, clusters da vida real nem sempre formam círculos. Vamos imaginar que um geólogo precisa encontrar alguns minerais semelhantes no mapa. Nesse caso, os clusters podem ter uma forma estranha. Além disso, você nem sabe quantos deles esperar. Seriam 10? 100? K-means não se encaixa aqui, mas o DBSCAN pode ser muito útil.

Vamos para um exemplo mais claro do K-means. Digamos que os nossos pontos sejam pessoas na praça da cidade. Encontra-se três pessoas próximas umas das outras e peça para elas darem as mãos. Então, diz-se a elas para começarem a pegar as mãos daqueles vizinhos que eles podem alcançar. E assim por diante, até que ninguém mais possa pegar a mão de ninguém. Esse é o nosso primeiro cluster.

Repita o processo até que todos estejam agrupados. Todas as pessoas que não conseguissem dar as mãos para outras pessoas seriam consideradas anomalias, neste caso.

Assim como a classificação, o agrupamento pode ser usado para detectar anomalias.
Um usuário se comporta de forma anormal depois de se inscrever? Deixe a máquina bani-lo temporariamente e crie um ticket para o suporte para verificá-lo. Talvez seja um bot. Nem precisa-se saber o que é “comportamento normal”, apenas faz-se o upload de todas as ações do usuário para o modelo e deixamos a máquina decidir se é um usuário “típico” ou não.

Esta abordagem não funciona tão bem em comparação com a classificação, mas nunca é demais tentar.

1.2.2 – Redução de Dimensionalidade (Generalização)

“Monta características específicas em mais alto nível”.

Usada nos dias de hoje para:

  • Criar sistemas de recomendação (★);
  • Criar belas visualizações;
  • Modelar tópicos e pesquisa de documentos similares;
  • Análise de imagens falsas;
  • Gerenciamento de riscos.

Algoritmos populares: Principal Component Analysis (PCA), Singular Value Decomposition(SVD), Latent Dirichlet allocation (LDA), Latent Semantic Analysis (LSA, pLSA, GLSA), t-SNE (para visualização).
 
Anteriormente, esses métodos eram usados por cientistas de dados experientes, que precisavam encontrar “algo interessante” em enormes quantidades de dados. Quando os gráficos do Excel não ajudaram, eles forçaram as máquinas a fazer a descoberta de padrões. É assim que eles criaram métodos de redução de dimensão.

É sempre mais conveniente que as pessoas usem abstrações, não um monte de recursos fragmentados. Por exemplo, podemos unir todos os cachorros com orelhas triangulares, narizes longos e caudas grandes a uma bela abstração denominada “pastor”. Sim, estamos perdendo algumas informações sobre os pastores específicos, mas a nova abstração é muito mais útil para nomear e explicar propósitos. Como bônus, esses modelos “abstratos” aprendem mais rápido, causam menos “overfit” e usam um número menor de características.

Esses algoritmos se tornaram ferramentas incríveis para Modelagem de Tópicos. Podemos abstrair de palavras específicas até seus significados. É isso que a análise semântica latente (LSA) faz. É baseada em quão frequente você vê a palavra em um tópico específico. Por exemplo, existem mais termos de tecnologia em artigos de tecnologia? Com certeza. Os nomes dos políticos também são encontrados principalmente em notícias políticas, entre outros exemplos.

Sim, podemos fazer clusters de todas as palavras nos artigos, mas perderemos todas as conexões importantes, como, por exemplo, palavras com um mesmo significado em contextos diferentes em documentos diferentes. A LSA lida com isso corretamente e é por isso que é chamada de “semântica latente”.

Então, precisamos conectar as palavras e documentos dentro da uma característica (feature) para manter essas conexões latentes. Ocorre que a decomposição Singular (SVD) resolve essa tarefa, revelando clusters de tópicos úteis a partir de aglomerados de palavras.

Sistemas de recomendação e filtragem colaborativa são outros usos super populares do método de redução de dimensionalidade. Se forem usados para abstrair as classificações do usuário, será um ótimo sistema para recomendar filmes, músicas, jogos e o que se quiser.

É quase impossível entender completamente essa abstração de máquina, mas é possível ver algumas correlações a partir de um olhar mais atento. Algumas delas se correlacionam com a idade do usuário – as crianças que brincam de Minecraft e também assistem mais desenhos animados; outros correlacionam-se com gênero de filme ou hobbies de usuário.

As máquinas obtêm esses conceitos de alto nível mesmo sem entendê-los, com base apenas no conhecimento das classificações dos usuários.

1.2.3 – Regras de Associação

“Procure padrões na ordem das escolhas”.

Usada nos dias de hoje para:

  • Para prever vendas e descontos;
  • Para analisar mercadorias compradas em conjunto;
  • Para colocar os produtos nas prateleiras;
  • Para analisar padrões de navegação na web.

Algoritmos populares: Apriori, Euclat, FP-growth.

A aprendizagem por regras de associação inclui todos os métodos para analisar carrinhos de compras, automatizar estratégias de marketing e outras tarefas relacionadas a eventos. Quando se tem uma sequência de algo e quer-se encontrar padrões nela – tenta-se associação.

Digamos que um cliente entre um um mercado, pegue um pacote de seis cervejas e vá para o caixa. Deveria colocar amendoins no caminho? Com que frequência as pessoas compram estes dois itens juntos?

Sim, provavelmente funciona para cerveja e amendoim, mas que outras sequências podemos prever? Pode uma pequena mudança no arranjo de mercadorias levar a um aumento significativo nos lucros?

O mesmo vale para o comércio eletrônico. A tarefa é ainda mais interessante – o que o cliente vai comprar da próxima vez?

O aprendizado por regras parece ser o menos elaborado na categoria de aprendizado de máquina. Os métodos clássicos são baseados em uma visão frontal de todos os produtos comprados usando árvores ou conjuntos. Algoritmos só podem procurar por padrões, mas não podem generalizar ou reproduzi-los em novos exemplos.

No mundo real, todo grande varejista constrói sua própria solução proprietária, portanto não há revoluções acontecendo aqui.

2 – Aprendizagem por Reforço

“Jogue um robô em um labirinto e deixe-o encontrar uma saída”.

Usada nos dias de hoje para:

  • Carros autônomos;
  • Jogos;
  • Automatizando a negociação;
  • Gerenciamento de recursos corporativos.

Algoritmos populares: Q-LearningSARSA, DQN, A3CGenetic algorithm.

Agora chegamos a algo que se parece com inteligência artificial real. Em muitos artigos, o aprendizado por reforço é colocado entre o aprendizado supervisionado e o não supervisionado, mas eles não têm nada em comum!

O aprendizado por reforço é usado nos casos em que seu problema não está relacionado a dados, mas você tem um ambiente virtual ou real para interação, como um mundo de videogame ou uma cidade para carros autônomos.

O conhecimento de todas as regras de trânsito no mundo não ensinará o piloto automático a dirigir nas estradas.

Independentemente da quantidade de dados que coletarmos, ainda não poderemos prever todas as situações possíveis. É por isso que seu objetivo é minimizar o erro, não prever todos os movimentos.

Veja o exemplo abaixo de redes neurais jogando Mário.

Sobreviver dentro de um ambiente é a idéia central do aprendizado por reforço. Através de um sistema de punições e recompensas o robô é ensinado da mesma maneira que uma criança aprende.

Um truque eficaz para construir um modelo de carros autônomos é construir uma cidade virtual e deixar o self-driving-car aprender primeiro todos os seus truques. É exatamente assim que treinamos pilotos automáticos no momento. Crie uma cidade virtual baseada em um mapa real, preencha com pedestres e deixe o carro aprender a matar o menor número possível de pessoas.

Quando o robô está razoavelmente confiante neste “GTA artificial”, é liberado para testar nas ruas reais. Diversão!
Pode haver ainda duas abordagens diferentes – com base em modelo e sem modelo.

Baseado em modelo significa que o carro precisa memorizar um mapa ou suas partes. Essa é uma abordagem bastante desatualizada, pois é impossível para o pobre carro autônomo memorizar o planeta inteiro.

No aprendizado sem modelo, o carro não memoriza todos os movimentos, mas tenta generalizar situações e agir racionalmente enquanto obtém uma recompensa máxima.

Lembra das notícias sobre a IA derrotando um dos melhores jogadores no jogo Go? Um pouco antes deste feito foi provado que o número de combinações neste jogo é maior que o número de átomos no universo.

Isso significa que a máquina mesmo sem se lembrar de todas as combinações, ainda assim, venceu no Go (como aconteceu no xadrez). A cada turno, ela simplesmente escolhia a melhor jogada para cada situação, superando o jogador humano ao final.

Essa abordagem é o conceito central por trás do Q-Learning e seus derivados (SARSA e DQN). ‘Q’ no nome significa “Qualidade”, pois um robô aprende a executar a ação mais “qualitativa” em cada situação e todas as situações são memorizadas como um simples processo markoviano

Essa máquina pode testar bilhões de situações em um ambiente virtual, lembrando quais soluções levaram a uma maior recompensa. Mas como ela pode distinguir situações já vistas anteriormente de uma outra completamente nova?

Se um carro autônomo está em uma estrada e o semáforo fica verde – isso significa que pode ir agora? E se houver uma ambulância correndo por uma rua próxima? A resposta hoje é “ninguém sabe”. Não há resposta fácil. Os pesquisadores estão constantemente pesquisando, mas enquanto isso, apenas encontram soluções alternativas.

Alguns codificariam manualmente todas as situações que os permitiam resolver casos excepcionais, como o Problema de Trolley. Outros se aprofundariam e deixariam as redes neurais fazer o trabalho de descobrir isso. Isso nos levou à evolução do Q-learning, chamado Deep Q-Network (DQN). Embora seja muito bom, não é uma bala de prata.

O aprendizado por reforço para uma pessoa comum pareceria uma inteligência artificial real. Porque faz-se pensar, esta máquina está tomando decisões em situações da vida real! Este tópico está no topo agora, avançando com um ritmo incrível.

Off-Topic. Há alguns anos, algoritmos genéticos eram realmente populares. Trata-se de lançar um monte de robôs em um único ambiente e fazê-los tentar atingir a meta até que eles morram. Depois, escolhemos os melhores, cruzamos-os, modificamos alguns genes e executamos novamente a simulação. Depois de alguns bilhões de anos, teremos uma criatura inteligente. Provavelmente. Evolução no seu melhor.

Os algoritmos genéticos são considerados parte do aprendizado por reforço e possuem a característica mais importante comprovada pela prática de uma década: ninguém dá a mínima para eles.

A humanidade ainda não conseguiu chegar a uma tarefa em que seriam mais eficazes do que outros métodos. Mas eles são ótimos para experiências de estudantes e deixam as pessoas entusiasmadas.

3 – Método Conjuntos (ensemble)

“Um bando de árvores estúpidas aprendendo a corrigir erros umas das outras”

Usado nos dias de hoje para:

  • Tudo o que se encaixa nas abordagens clássicas de algoritmos (mas funciona melhor);
  • Sistemas de busca (★);
  • Visão computacional;
  • Detecção de objetos.

Algoritmos Populares: Random ForestGradient Boosting.
 
Finalmente chegamos aos métodos considerados mais vanguarda. Ensemble e Redes Neurais são os dois principais competidores na disputa para o caminho para a singularidade. Hoje eles estão produzindo os resultados mais precisos e são amplamente utilizados em produção.

Apesar de toda a eficácia, a idéia por trás disso é excessivamente simples. Pegando-se um monte de algoritmos ineficientes e forçando-os a corrigir os erros um dos outros, a qualidade geral de um sistema será maior do que os melhores algoritmos individuais.

Obter-se-á resultados ainda melhores com o uso dos algoritmos mais instáveis que estão prevendo resultados completamente diferentes com pouco ruído nos dados de entrada. A Regressão e Árvores de Decisão, por exemplo, são tão sensíveis que até mesmo um único dado fora do comum (outlier) nos dados de entrada pode levar os modelos a enlouquecerem.

Pode-se usar qualquer algoritmo que conhecemos para criar um Ensenble, que na tradução é “conjunto”. Basta jogar um monte de classificadores, apimentar com regressão e não se esqueça de medir a precisão. Por outro lado evita-se um Bayes ou kNN aqui. Embora “burros”, eles são realmente estáveis.

Em vez disso, existem três métodos testados em campo para criar Ensembles.

3.1 – Empilhamento (stacking)

A saída de vários modelos paralelos é passada como entrada para o último que toma uma decisão final. É como aquela garota que pergunta para as amigas se deve se encontrar com alguém, antes de tomar uma decisão final. Não somos tão diferentes desses algoritmos não é mesmo?

Ressalto aqui a palavra “diferente”. Misturar os mesmos algoritmos nos mesmos dados não faria sentido. A escolha dos algoritmos é totalmente de quem está resolvendo o problema. No entanto, para o modelo final de tomada de decisão, a regressão geralmente é uma boa escolha.
Na prática, o Stacking tem sido menos popular porque os dois próximos métodos estão fornecendo melhor precisão.

3.2 – Ensacamento (bagging)

Também conhecido como Bootstrap AGGregatING. É um método que usa os mesmos algoritmos, mas treina-os com diferentes subconjuntos de dados originais e no final usa apenas os resultados médios.
Dados em subconjuntos aleatórios podem se repetir. Por exemplo, de um conjunto como “1-2-3”, podemos obter subconjuntos como “2-2-3”, “1-2-2”, “3-1-2” e assim por diante. Usamos esses novos conjuntos de dados para ensinar o mesmo algoritmo várias vezes e, em seguida, prever a resposta final por meio da votação majoritária simples.

O exemplo mais famoso de Bagging é o algoritmo Random Forest que é simplesmente resultado de várias árvores de decisão, conforme ilustrado acima.

Quando se abre o aplicativo de câmera do telefone e o vê desenhando caixas em volta do rosto das pessoas – provavelmente é o resultado do trabalho do Random Forest. As redes neurais seriam muito lentas para serem executadas em tempo real, por isso, o método de Bagging, neste caso, é o ideal.

Em algumas tarefas, a capacidade do Random Forest de executar em paralelo é mais importante do que uma pequena perda de precisão no reforço, por exemplo. Especialmente no processamento em tempo real. Quando falamos de Machine Learning, sempre temos um trade-off.

3.3 – Impulsionamento (boosting)

No método de Boosting, os algoritmos são treinados um a um sequencialmente. Cada algoritmo subsequente presta mais atenção aos pontos de dados que foram imprevisíveis pelo anterior. Esse processo ocorre até o resultado ser satisfatório.

Do mesmo modo que o método Bagging, usamos subconjuntos de nossos dados, mas desta vez eles não são gerados aleatoriamente. Agora, em cada subamostra, coletamos uma parte dos dados que o algoritmo anterior falhou ao processar

Assim, o novo algoritmo aprende a corrigir os erros do anterior.

A principal vantagem aqui é uma precisão de classificação muito alta. Os contras já foram destacados – não são processados de forma paralela, o que pode torná-lo não tão rápido. Entretanto, ainda assim, é mais rápido que as redes neurais.

Na verdade, é como uma corrida entre um caminhão de lixo e um carro de corrida. O caminhão pode fazer mais, mas se você quiser ir mais rápido, pegue um automóvel.

Se você quiser um exemplo real do Método de Boosting é só abrir o Facebook ou o Google e começar a digitar uma consulta de pesquisa. O resultado dessa pesquisa é trazido pelo Método Ensemble utilizando boosting.

4 – Redes Neurais e Aprendizagem Profunda

“Temos uma rede de mil camadas, dezenas de placas de vídeo, mas ainda não sabemos onde usá-la. Vamos gerar fotos de gatos!”.

Usado nos dias de hoje para:

  • Substituição dos algoritmos de aprendizagem de máquina tradicionais;
  • Identificação de objetos em fotos e vídeos;
  • Reconhecimento e síntese de fala;
  • Processamento de imagem, transferência de estilo;
  • Maquina de tradução.

Arquiteturas Populares: PerceptronConvolutional Network (CNN), Recurrent Networks (RNN), Autoencoders

Qualquer rede neural artificial é basicamente uma coleção de neurônios artificiais e conexões entre eles. O neurônio é uma função com várias entradas e uma saída. Sua tarefa é pegar todos os números de sua entrada, executar uma função neles e enviar o resultado para a saída.

Aqui está um exemplo de um neurônio simples, mas útil na vida real: some todos os números das entradas e se essa soma for maior que N – dê “1” como resultado. Caso contrário – “zero”.

As conexões são como canais entre os neurônios. Eles conectam as saídas de um neurônio às entradas de outro, para que possam enviar dígitos um para o outro. Cada conexão possui apenas um parâmetro – peso. É como uma força de conexão para um sinal. Quando o número 10 passa por uma conexão com um peso 0,5, ele se transforma em 5.

Esses pesos dizem ao neurônio para responder mais a uma entrada e menos a outra. Os pesos são ajustados durante o treinamento – é assim que a rede aprende. Basicamente, é só isso.

Para impedir que a rede caia na anarquia, os neurônios são ligados por camadas, não aleatoriamente. Dentro de uma camada, os neurônios não estão conectados, mas estão conectados aos neurônios da camada “seguinte” e da camada “anterior”. Os dados na rede vão estritamente em uma direção – das entradas da primeira camada às saídas da última.

Se você lançar um número suficiente de camadas e colocar os pesos corretamente, obterá o seguinte: aplicando à entrada, digamos, a imagem do dígito manuscrito 4, pixels pretos ativam os neurônios associados, eles ativam as próximas camadas e assim por diante, até que finalmente acenda a saída encarregada dos quatro. O resultado é alcançado.

Uma rede que possui várias camadas que têm conexões entre todos os neurônios é chamada de perceptron (MLP), conforme imagem acima, e é considerada a arquitetura mais simples para um iniciante, embora não seja vista em produção.

Ao fazer a programação da vida real, ninguém escreve neurônios e conexões. Em vez disso, tudo é representado como matrizes e calculado com base na multiplicação de matrizes para melhor desempenho.

Este vídeo sobre isso, e sua sequência abaixo, descreve todo o processo de uma maneira facilmente digerível, usando o exemplo do reconhecimento de dígitos escritos à mão. Assista-o se você quiser entender melhor.

Depois que construímos uma rede, nossa tarefa é atribuir maneiras apropriadas para que os neurônios reajam corretamente aos sinais recebidos. Agora é a hora de lembrar que temos dados que são amostras de ‘entradas’ e ‘saídas’ apropriadas. Mostraremos à nossa rede um desenho do mesmo dígito 4 e informaremos ‘adapte seus pesos para que, sempre que você vir essa entrada, sua saída emita 4’.
Para começar, todos os pesos são atribuídos aleatoriamente. Depois que mostramos um dígito, ele emite uma resposta aleatória porque os pesos ainda não estão corretos e comparamos o quanto esse resultado difere do correto.

Então começa-se a atravessar a rede de saída para entrada e dizemos a todos os neurônios: “ei, você ativou aqui, mas você fez um péssimo trabalho, vamos dar menos atenção a essa e mais a essa outra, ok?”

Depois de centenas de milhares de ciclos desse tipo de ‘inferir / punir’, há uma esperança de que os pesos sejam corrigidos e ajam como pretendido. O nome científico dessa abordagem é Backpropagation. O engraçado foi que levaram vinte anos para criar esse método. Esse segundo vídeo descreve esse processo com maior profundidade, mas ainda é muito acessível.

Uma rede neural bem treinada pode falsificar o trabalho de qualquer um dos algoritmos descritos neste capítulo (e freqüentemente funciona com mais precisão). Essa universalidade é o que a tornou amplamente popular.

Finalmente, temos uma arquitetura do cérebro humano, eles disseram que precisamos montar muitas camadas e ensiná-las sobre todos os dados possíveis que esperavam. Então, o primeiro inverno da IA começou, depois se derreteu e outra onda de decepção ocorreu.

Descobriu-se que as redes com um grande número de camadas exigiam um poder de computação inimaginável na época.
Atualmente, qualquer PC com placas de vídeo Geforce supera os datacenters da época. Portanto, as pessoas não tinham nenhuma esperança de adquirir poder computacional como os que hoje temoa acesso e as redes neurais eram uma chatice enorme.

E então, dez anos atrás, o Deep Learning floresceu!

Há uma boa linha do tempo de aprendizado de máquina descrevendo a montanha-russa de esperanças e ondas de pessimismo.
Em 2012, as redes neurais convolucionais conquistaram uma vitória esmagadora na competição ImageNet que fez o mundo se lembrar repentinamente dos métodos de Deep Learning descritos nos anos 90 e que agora se tornam viáveis com nossas placas de vídeo!

As diferenças do Deep Learning das redes neurais clássicas estavam em novos métodos de treinamento que podiam lidar com redes maiores. Atualmente, apenas a teoria tentaria dividir qual aprendizado considerar profundo e não tão profundo.
Nós, como profissionais, usamos bibliotecas ‘profundas’ populares como KerasTensorFlowPyTorch, mesmo quando construímos uma mini-rede com cinco camadas. Só porque é mais adequado do que todas as ferramentas que vieram antes.
Nós apenas as chamamos de redes neurais.
Existe um artigo excelente chamado Neural Network Zoo, onde quase todos os tipos de redes neurais são explicadas brevemente.

Se gostou, por favor, compartilhe e não deixe de ler o post sobre Neurônios e Redes Neurais Artificiais.

Conte comigo em seus projetos. Sobre mim: aqui. Contato: aqui.

Um abraço, @neigrando

Referência

Este artigo trata-se da adaptação, redução e tradução, do post, em inglês, “Machine Learning for Everyone“.

Artigos relacionados