👩🏾‍✈️ 🙏🏻 👌🏽 Tecnología de reconocimiento facial: una historia secreta 💻 🤹🏾 🦊

Hace sesenta años, Woody Bledsoe, hijo de un granjero, inventó la tecnología de identificación facial. Pero la evidencia de su participación en el descubrimiento prácticamente ha desaparecido.

Los editores de Netology han preparado una traducción adaptada del artículo de Wired sobre esta incógnita a un amplio círculo de la historia, sobre los desarrollos de Bledsoe y su equipo, que se utilizan en la tecnología moderna de reconocimiento facial.

Durante unos treinta años, Woody Bledsoe fue profesor en la Universidad de Texas en Austin y trabajó en el desarrollo del razonamiento automatizado y la inteligencia artificial. Según las memorias de Lance, hijo de Bledsoe, el profesor era un científico entusiasta y optimista que, a finales de la década de 1950, soñaba con crear una computadora dotada de capacidades humanas y capaz de demostrar complejos teoremas matemáticos, mantener una conversación y jugar al ping-pong decente.

Pero al principio de su carrera, Bledsoe buscaba ansiosamente la oportunidad de enseñar a las máquinas a reconocer rostros, una habilidad humana subestimada pero potencialmente poderosa. Estos fueron los primeros estudios sobre identificación de rostros (1960), y el trabajo del profesor atrajo el interés de los servicios de inteligencia estadounidenses. Los principales inversores de Woody eran probablemente empresas fachada de la CIA.

:

Hoy en día, el reconocimiento facial se utiliza para garantizar la seguridad en teléfonos, computadoras portátiles, pasaportes y aplicaciones de pago. Se espera que esta tecnología revolucione el mercado de la publicidad dirigida y acelere el diagnóstico de ciertas enfermedades. Al mismo tiempo, la tecnología de identificación facial se está convirtiendo en un instrumento de presión gubernamental y vigilancia empresarial.

Por ejemplo, con la ayuda de esta tecnología en China, el gobierno está rastreando a representantes de la minoría étnica uigur, cientos de miles de los cuales han sido colocados en campos de prisioneros políticos. Y en los Estados Unidos, según The Washington Post, la Policía de Inmigración y Aduanas y el FBI están realizando una búsqueda digital: buscando sospechosos en las bases de datos gubernamentales de licencias de conducir, a veces sin acudir primero a los tribunales.

En 2019, una investigación del Financial Times reveló que investigadores de Microsoft y la Universidad de Stanford recopilaron y pusieron a disposición del público una gran cantidad de paquetes de datos de imágenes de personas sin el conocimiento o consentimiento de los fotografiados. Posteriormente, estos datos fueron destruidos, pero los investigadores de nuevas empresas tecnológicas y una academia militar china lograron obtenerlos.

La investigación de Woody Bledsoe sobre el reconocimiento facial en la década de 1960 anticipó los avances tecnológicos y las implicaciones éticas que estamos viendo hoy. Sin embargo, estas obras fundamentales son casi completamente desconocidas, la mayoría de ellas nunca se han hecho públicas.

En 1995, por razones desconocidas, Woody le pidió a su hijo que destruyera el archivo de investigación. Pero la mayoría de los artículos sobrevivieron y miles de páginas de su trabajo se encuentran ahora en el Centro Briscoe de Historia Estadounidense de la Universidad de Texas.

Entre otras cosas, han sobrevivido decenas de fotografías de personas, y algunos rostros están marcados con extrañas notas matemáticas, como si sufrieran algún tipo de enfermedad "geométrica" de la piel. En estos retratos, se puede discernir la historia del surgimiento de la tecnología, que en las próximas décadas se desarrollará y penetrará activamente en muchas áreas de la actividad humana.

Cómo todo empezó. Método de tupla

Woodrow Wilson (Woody) Bledsoe nació en 1921 en una gran familia de un aparcero de Oklahoma. Era el décimo hijo de la familia y, hasta donde podía recordar, siempre ayudaba a su padre con las tareas del hogar. Poseía una mentalidad matemática. Graduado de la secundaria. Estudió durante tres meses en la Universidad de Oklahoma, después de lo cual Woody fue reclutado en el ejército en vísperas de la Segunda Guerra Mundial.

Después de la guerra, Woody estudió matemáticas en la Universidad de Utah y luego se fue a Berkeley para realizar su doctorado. Después de graduarse de la escuela de posgrado, Woody trabajó en investigación de armas nucleares en Sandia Corporation, propiedad del gobierno, en Nuevo México, junto con luminarias como Stanislaw Ulam, quien ayudó a crear la bomba de hidrógeno.

En Sandia, Woody dio los primeros pasos en el mundo de la informática, compromiso con el que continuará durante toda su vida. Primero escribí el código para proyectos de armas nucleares. Y más tarde, Woody se interesó en el reconocimiento automático de patrones, especialmente en la lectura automática, el proceso de enseñar al sistema a reconocer imágenes sin marcar de caracteres escritos.

Woody Bledsoe y su colega Iben Browning, un erudito, ingeniero aeronáutico y biofísico, idearon un método que más tarde se conocería como el método n-tupla.

Los científicos comenzaron proyectando un símbolo impreso, digamos la letra Q, en una cuadrícula rectangular de celdas, como una hoja de papel rayado. A cada celda-celda se le asignó un número binario dependiendo de la presencia o ausencia de una parte del símbolo en ella: 0 - para una celda vacía, 1 - para una llena. Luego, las celdas se agruparon aleatoriamente en pares ordenados como conjuntos de coordenadas. En teoría, los grupos podrían incluir cualquier número de celdas, de ahí el nombre del método. Luego, utilizando varios pasos matemáticos, el sistema asignó un valor único a la cuadrícula de símbolos. Y cuando se encontró un nuevo símbolo, la cuadrícula de ese símbolo se comparó con otros en la base de datos hasta que se encontró la coincidencia más cercana.

La esencia del método era que permitía reconocer muchas variantes del mismo signo: la mayoría de las Q tendían a obtener resultados bastante similares en comparación con otras Q. El proceso funcionaba mejor con cualquier patrón, no solo con texto. Según Robert S. Boyer, matemático y amigo de toda la vida de Woody, el método de la tupla ayudó a definir el alcance del reconocimiento de patrones. Este fue uno de los primeros pasos de la pregunta: "¿Cómo puedo programar una máquina para que haga lo que hace la gente?"

Alrededor de la época en que estaba desarrollando el método de las tuplas, Woody soñó por primera vez con crear una máquina, a la que llamó "hombre de la computadora".

Años más tarde, recordó la “emoción salvaje” que sintió al formular habilidades para la inteligencia artificial:

“Quería que leyera caracteres mecanografiados y texto escrito a mano. Podía verlo a él o parte de él en una pequeña cámara que estaría pegada a mis lentes, con un auricular a través del cual lo escuchaba llamar los nombres de mis amigos y conocidos cuando los encontraba en la calle ... Verás, mi amigo de la computadora podría para reconocer caras ".

Investigación en Panoramic Research Incorporated

En 1960, Woody, junto con Iben Browning y otro colega de Sandia, fundaron Panoramic Research Incorporated (Panoramic). Inicialmente se alojaron en un pequeño edificio en Palo Alto, que aún no se conocía como el corazón de Silicon Valley. En ese momento, la mayoría de las computadoras, dispositivos masivos que almacenaban datos en tarjetas perforadas o cintas magnéticas, estaban alojadas en las oficinas de grandes empresas y laboratorios gubernamentales. La compañía de Woody no podía permitirse comprar una computadora, por lo que los científicos alquilaron tiempo de computación en una máquina de este tipo a sus vecinos, a menudo a altas horas de la noche cuando era más barato.

El negocio de Panoramic era "probar ideas que esperábamos que dieran la vuelta al mundo".

Según Nels Winkless, un escritor y consultor que participó en varios proyectos Panoramic y luego cofundó la revista Personal Computing, "su trabajo era hacer lo que otras personas encuentran demasiado tonto".

Las invenciones de algunos de los investigadores de Panoramic se han vuelto ampliamente conocidas. Por ejemplo, Helen Chan Wolf, pionera en programación de robots, trabajó en Shakey the Robot. Según el Instituto de Ingenieros Eléctricos y Electrónicos, es "el primer robot del mundo que incorpora inteligencia artificial".

Panoramic intentó en vano encontrar financiación. Woody hizo todo lo posible para presentar la tecnología de reconocimiento de personajes, incluida la presentación de la invención a la Fair Life Insurance Society y a la revista McCall. Pero el contrato nunca se firmó.

A lo largo de su existencia, Panoramic ha tenido al menos un patrocinador confiable para mantenerlo a flote, la Agencia Central de Inteligencia.

Si había referencias a la CIA en los documentos de Woody Bledsoe, lo más probable es que fueran destruidas en 1995. Pero fragmentos de material sobreviviente indican claramente que la compañía de Woody trabajó con compañías fachada de la CIA durante muchos años. Nels Winkless, que era amigo del equipo de Panoramic, dice que lo más probable es que la empresa se haya creado con fondos de la agencia. "Nadie me lo dijo directamente", recuerda Winkless, "pero lo fue".

Panoramic Research Incorporated fue una de las 80 organizaciones que trabajaban en el proyecto MK-Ultra, según el sitio de consultas de la Ley de Acceso Libre a la Información (FDA), Black Vault. Este es el infame programa de "control mental" de la CIA que utilizó la tortura psicológica sin el consentimiento de la gente. A través de la fundación de investigación ficticia de la Medical Sciences Research Foundation, Panoramic recibió el encargo de emprender subproyectos para estudiar las toxinas bacterianas y fúngicas y para "controlar de forma remota ciertas especies animales".

David H. Price, antropólogo de la Universidad de Saint Martin, creía que Woody y sus colegas también recibieron dinero de la Sociedad para el Estudio de la Ecología Humana. En nombre de esta sociedad, la CIA otorgó subvenciones a científicos cuyo trabajo podría mejorar los métodos de interrogatorio utilizados por la agencia o actuar como tapadera para dicha investigación.

Pero la investigación más significativa de Panoramic fue proporcionada por otra empresa ficticia, el Grupo de Investigación King-Hurley (King-Hurley). Según una serie de demandas presentadas en la década de 1970, la CIA utilizó este equipo de investigación para adquirir aviones y helicópteros para la agencia secreta de la fuerza aérea conocida como Air America. Durante un tiempo, King-Hurley también financió la investigación psicofarmacológica en Stanford.

A principios de 1963, King-Hurley solo aceptaba varias presentaciones de ideas de Woody Bledsoe. Propuso realizar "investigaciones para determinar la viabilidad de crear una máquina de reconocimiento facial simplificada". Basándose en su trabajo con Browning en el método de tuplas, Woody quería enseñarle al sistema a reconocer 10 caras. Es decir, planeaba usar una base de datos de 10 fotos de diferentes personas y ver si la máquina podía identificar nuevas fotos de cada una de ellas. “Pronto será posible aumentar el número de personas a miles”, escribió Woody. En un mes, King-Hurley le dio permiso para empezar a trabajar.

Primeros experimentos en el campo del reconocimiento facial

Identificar a diez personas puede parecer hoy un objetivo bastante modesto, pero en 1963 era increíblemente ambicioso. El salto del reconocimiento de caracteres escrito al reconocimiento facial ha sido enorme. Aunque solo sea porque no había un método estándar para digitalizar fotografías, ni una base de imágenes digitales existente en la que confiar. Los investigadores modernos pueden entrenar sus algoritmos en millones de selfies gratuitos, y Panoramic tendría que construir una base de datos desde cero.

Había un problema más grave: los rostros tridimensionales de las personas, a diferencia de los signos bidimensionales, no son estáticos. Las imágenes de la misma persona pueden diferir en la rotación de la cabeza, la intensidad de la luz y el ángulo, así como también en función de la edad, el peinado y el estado de ánimo: en una foto, una persona puede parecer despreocupada, en otra, ansiosa.

Por analogía con encontrar un denominador común en una fracción extremadamente compleja, el equipo tuvo que ajustar la variabilidad y ordenar las imágenes que estaban comparando.

Y difícilmente sería posible decir con confianza que sus computadoras harán frente a esta tarea. Una de las máquinas principales fue el CDC 1604 con 192 KB de RAM, aproximadamente 21.000 veces menos que un teléfono inteligente moderno típico.

Desde el principio, Woody fue plenamente consciente de estas complejidades, por lo que adoptó un enfoque de divide y vencerás: dividió la investigación en pedazos y los asignó a diferentes colaboradores.

El trabajo de digitalización de las imágenes se llevó a cabo de la siguiente manera. El investigador tomó fotografías en blanco y negro de los participantes del proyecto en una película de 16 mm. Luego utilizó el dispositivo de escaneo que Browning había desarrollado para transformar cada imagen en decenas de miles de puntos de datos. Cada punto tenía que tener un valor de intensidad de luz en el rango de 0 (más oscuro) a 3 (más claro), en un lugar determinado de la imagen. Había demasiados puntos para ser procesados por la computadora a la vez, por lo que el investigador escribió el programa NUBLOB, que dividió la imagen en muestras aleatorias y calculó un valor único para cada uno, como los asignados mediante el método de tupla.

Woody, Helen Chan Wolfe y otro investigador trabajaron en la inclinación de la cabeza. Primero, los científicos dibujaron una serie de pequeñas cruces numeradas en el lado izquierdo de la cara del sujeto, desde la parte superior de la frente hasta la barbilla. Luego hicieron dos retratos, en uno de los cuales el hombre miraba hacia adelante, y en el otro giraba 45 grados. Tras analizar la ubicación de las cruces en estas dos imágenes, los datos se extrapolaron a una imagen de rostro con una rotación de 15 o 30 grados. Una imagen en blanco y negro de una cara marcada se cargó en una computadora, y el resultado fue un retrato que giraba automáticamente: aterrador, preciso y sorprendentemente preciso.

Las soluciones de los investigadores fueron originales, pero no lo suficientemente efectivas. Trece meses después de comenzar a trabajar, el equipo de Panoramic admitió que no habían logrado entrenar a la máquina para reconocer al menos una cara, y mucho menos diez.

Crecimiento del cabello, expresiones faciales y signos de envejecimiento: este triple desafío representó "una fuente colosal de variabilidad", escribió Woody en su informe de progreso de marzo de 1964 a King-Hurley. La tarea establecida "va más allá del estado actual del campo del reconocimiento de patrones y las tecnologías informáticas modernas". Al hacerlo, Woody recomendó financiar más investigaciones para tratar de encontrar un "enfoque completamente nuevo" para resolver el problema del reconocimiento facial.

Enfoque "humano-máquina" para el reconocimiento facial

Durante el año siguiente, Woody llegó a la conclusión de que el enfoque más prometedor para el reconocimiento facial automatizado es el que reduce el área a las relaciones entre los elementos principales: ojos, oídos, nariz, cejas, labios.

El sistema que propuso era similar al del criminólogo francés Alphonse Bertillon, que creó en 1879. Bertillon describió a las personas basándose en 11 medidas físicas, incluida la longitud de la pierna izquierda y la longitud desde el codo hasta el final del dedo medio. La idea era que si se tomaban suficientes medidas, cada persona sería única. El método fue laborioso, pero funcionó: con su ayuda en 1897, mucho antes del uso generalizado de las huellas dactilares, los gendarmes franceses identificaron al asesino en serie Joseph Vas.

A lo largo de 1965, Panoramic intentó crear un sistema de identificación facial Bertillon totalmente automatizado. El equipo estaba tratando de desarrollar un programa que pudiera definir narices, labios y más usando áreas claras y oscuras en una fotografía. Pero fallaron.

Luego, Woody y Wolfe adoptaron lo que llamaron el enfoque "humano-máquina" para el reconocimiento facial, una técnica que incorporó un poco de información humana a la ecuación.

Woody reclutó a su hijo Gregory y a su amigo para el proyecto: se les dieron 122 fotografías de unas 50 personas. Los chicos tomaron 22 medidas de cada cara, incluida la longitud de la oreja y el ancho de la boca. Luego, Wolfe escribió un programa para procesar los datos.

. , : , .

Su siguiente paso, a finales de 1965, fue crear una versión más grande del mismo experimento para hacer "humano" más eficiente en su sistema humano-máquina. Con el dinero de King-Hurley, compraron la tableta RAND, un dispositivo de $ 18,000 que parecía un escáner de imágenes de superficie plana pero que funcionaba como un iPad. Usando un lápiz, el investigador dibujó en una tableta y en la salida recibió una imagen de computadora de una resolución relativamente alta.

Se tomó un nuevo lote de fotos a través de la tableta RAND, enfatizando los elementos clave del rostro con el lápiz óptico. Este proceso, aunque complejo, fue mucho más rápido que antes: se ingresaron datos para unas 2.000 imágenes, incluidas al menos dos imágenes de cada rostro. Se procesaron unas 40 imágenes por hora.

Incluso con esta muestra más grande, el equipo de Woody luchó por superar los obstáculos habituales.

El problema de las sonrisas, que “distorsionan el rostro y cambian radicalmente las dimensiones interfaciales”, así como el envejecimiento, aún no se ha resuelto.

Al intentar hacer coincidir la foto de Woody de 1945 con la de 1965, el sistema se confundió. Vio poca semejanza entre un hombre joven con una amplia sonrisa y cabello oscuro y espeso y un hombre mayor con una expresión sombría y cabello ralo.

Foto de Woody Bledsoe de un estudio de 1965. Fotógrafo: Dan Winters

Fue como si décadas hubieran creado una persona diferente, y en cierto sentido lo fue. En este punto, Woody estaba cansado de buscar nuevos contratos para Panoramic y se encontró "en la ridícula posición de demasiado trabajo o no lo suficiente". Continuamente presentaba nuevas ideas a sus patrocinadores, algunas de las cuales son éticamente cuestionables en la actualidad.

En marzo de 1965, 50 años antes de que China comenzara a usar la coincidencia facial para identificar a los uigures étnicos en la provincia de Xinjiang, Woody invitó a la Agencia de Proyectos de Investigación Avanzada (ARPA) del Departamento de Defensa de los Estados Unidos a apoyar a Panoramic en el estudio del uso de rasgos. personas para determinar el origen racial de una persona. "Hay una gran cantidad de dimensiones antropológicas de personas de todo el mundo que pertenecen a diferentes grupos raciales y ecológicos", escribió Woody. "Es un almacén de datos vasto y valioso que se ha recopilado con gran dificultad y gasto, pero no se ha utilizado correctamente". Se desconoce si ARPA ha aceptado financiar este proyecto.

Woody invirtió miles de dólares en Panoramic de sus propios fondos sin garantía de devolución. Mientras tanto, sus amigos de la Universidad de Texas en Austin lo persuadieron para que consiguiera un trabajo en la universidad, atrayéndolo con un salario estable. Y en enero de 1966, Woody dejó Panoramic. La empresa cerró poco después.

Con el sueño de crear un hombre informático, Woody se mudó con su familia a Austin para dedicarse al estudio y la enseñanza del razonamiento automatizado. Pero su trabajo en tecnología de reconocimiento facial no terminó ahí.

El experimento de reconocimiento facial más exitoso de Woody Bledsoe

En 1967, Woody asumió una tarea final relacionada con el reconocimiento de patrones faciales. El propósito del experimento era ayudar a las fuerzas del orden a examinar rápidamente las bases de datos de personas arrestadas en busca de coincidencias.

Como antes, la financiación del proyecto parece provenir del gobierno de Estados Unidos. Un documento de 1967, desclasificado por la CIA en 2005, menciona un "contrato externo" para un sistema de reconocimiento facial que reduciría cien veces los tiempos de búsqueda.

El principal socio del proyecto de Woody fue Peter Hart, un ingeniero de investigación del Laboratorio de Física Aplicada del Instituto de Investigación de Stanford. (Ahora conocido como SRI International. El instituto se separó de la Universidad de Stanford en 1970 debido a diferencias en el campus sobre la fuerte dependencia del instituto de la financiación militar).

Woody y Hart comenzaron con una base de datos de aproximadamente 800 imágenes, dos de cada "400 varones adultos caucásicos". Los fotografiados diferían en edad y giro de cabeza. Usando una tableta RAND, los científicos registraron 46 coordenadas para cada fotografía, incluidos cinco valores para cada oído, siete para la nariz y cuatro para cada ceja. Sobre la base de la experiencia previa de Woody con la normalización de la variación de la imagen, se utilizó una ecuación matemática para "girar" las cabezas en vista frontal. Luego, para tener en cuenta la diferencia de escala, cada imagen se amplió o redujo a un tamaño estándar, donde la métrica de referencia era la distancia entre las pupilas.

La tarea del sistema era memorizar una versión de cada persona y usarla para identificar a la otra.

Woody y Hart le ofrecieron al auto uno de dos atajos. En el primero, conocido como coincidencia de grupo, el sistema dividió la cara en rasgos (ceja izquierda, oreja derecha, etc.) y comparó las distancias relativas entre ellos.

Fotógrafo: Dan Winters El

segundo enfoque se basó en la teoría de la decisión bayesiana, donde la máquina utilizó 22 dimensiones para hacer una suposición general.

Como resultado, ambos programas hicieron frente a la tarea aproximadamente igual de bien. Y también resultó ser mejor que los rivales humanos. Cuando Woody y Hart pidieron a tres personas que emparejaran subgrupos de 100 individuos, incluso el más rápido de ellos tomó seis horas. El CDC 3800 completó una tarea similar en aproximadamente tres minutos, logrando una reducción de tiempo de 100 veces. Los humanos manejaban mejor los giros de cabeza y la mala calidad de las fotografías, pero la computadora era "muy superior" en la detección de cambios relacionados con la edad.

Los investigadores concluyeron que la máquina "domina" o "casi domina" a la persona. Este fue el mayor éxito de Woody en su investigación sobre el reconocimiento facial.

También fue su último trabajo sobre el tema, que nunca se publicó "en interés del estado", lo que Woody y Hart lamentaron mucho.

En 1970, dos años después del final de su colaboración con Hart, un técnico de robots llamado Michael Kassler le dijo a Woody que Leon Harmon de Bell Labs estaba planeando un estudio sobre reconocimiento facial. "Estoy indignado de que este segundo tipo de estudio se publique y termine siendo el mejor sistema hombre-máquina", respondió Woody. "Creo que con mucho trabajo, Leon estará unos 10 años detrás de nosotros en 1975". año ”. Woody debió sentirse decepcionado cuando la investigación de Harmon apareció en la portada de Scientific American unos años después, mientras que su propio trabajo más avanzado se guardaba en los almacenes.

Usando el método Woody Bledsoe en la tecnología moderna de reconocimiento facial

En las décadas siguientes, Woody ganó premios por sus contribuciones al razonamiento automatizado. Durante un año, se desempeñó como presidente de la Asociación para el Desarrollo de la Inteligencia Artificial. Pero su trabajo sobre el reconocimiento facial permaneció en gran parte desconocido y casi olvidado, mientras que otros estaban recolectando laureles.

En 1973, el científico informático japonés Takeo Kanade dio un gran salto en la tecnología de reconocimiento facial.

Basándose en una base de datos de 850 fotografías digitalizadas de la Feria Mundial de Sweet (Japón) en 1970, Canadá desarrolló un programa que podía extraer rasgos faciales (nariz, boca y ojos) sin intervención humana. Canadá ha logrado cumplir el sueño de Woody de excluir al hombre del sistema hombre-máquina.

Woody ha utilizado su conocimiento del reconocimiento facial un par de veces a lo largo de los años.

En 1982, fue contratado como experto en un caso penal en California. Un presunto miembro de la mafia mexicana fue acusado de cometer una serie de robos en el condado de Contra Costa. El fiscal tenía varias pruebas, incluidas imágenes de videovigilancia de un hombre de cabello largo con barba, gafas de sol y un sombrero de invierno. Pero en las fotografías, el acusado parecía ser un hombre bien afeitado y de pelo corto. Woody midió el rostro del ladrón, lo comparó con fotografías del acusado y descubrió que los rostros pertenecían a dos personas diferentes debido a la diferencia en el ancho de las narices. A pesar de que el hombre aún fue a la cárcel, fue absuelto de cuatro cargos, de los que Woody fue testigo.

“Solo en los últimos 10 años, la tecnología de reconocimiento facial ha aprendido a lidiar con las imperfecciones”, dice Anil K. Jain, científico de software de la Universidad Estatal de Michigan y coeditor del Handbook of Face Recognition.

Casi todos los problemas que enfrentó Woody han desaparecido. Hoy en día existe una oferta inagotable de imágenes digitalizadas. "A través de las redes sociales, puede obtener tantas fotografías faciales como desee", dice Jane. Y gracias a los avances en el aprendizaje automático, la memoria y la potencia de procesamiento, las computadoras aprenden a aprender de manera efectiva. Con unas pocas reglas simples, pueden analizar grandes cantidades de datos y crear plantillas para casi cualquier cosa, desde un rostro humano hasta una bolsa de chips; no se requieren más mediciones con una tableta RAND o el método Bertillon.

Incluso considerando lo lejos que ha llegado el reconocimiento facial desde mediados de la década de 1960, Woody Bledsoe identificó muchos de los desafíos que quedan por abordar en esta área.

, - . , , , .

Si bien el programador no instruye explícitamente a los sistemas modernos de aprendizaje profundo para identificar narices y cejas, el giro de Woody en esta dirección en 1965 marcó la dirección de la industria durante décadas. “Durante los primeros 40 años fue la extracción de características lo que dominó”, dice Takeo Kanade, ahora profesor en el Instituto Carnegie Mellon de Robótica.

Hoy, hasta cierto punto, han vuelto a lo que se asemeja a los primeros intentos de Woody de "figurar" un rostro humano, cuando usó una variación del método de tupla para encontrar patrones de características similares en un campo gigante de puntos de datos. Por complejos que sean los sistemas modernos de reconocimiento facial, Anil Jane dice que simplemente comparan pares de imágenes y les asignan una puntuación de similitud.

Pero quizás lo más importante es que el trabajo de Woody Bledsoe ha establecido el tono ético para la investigación del reconocimiento facial, tanto relevante como problemático. A diferencia de otras tecnologías que cambiaron el mundo cuyas capacidades catastróficas se hicieron evidentes a lo largo de los años (redes sociales, YouTube, drones), el abuso potencial de la tecnología de reconocimiento facial ha sido evidente casi desde el momento en que nació en Panoramic.

Muchos prejuicios que pueden atribuirse a los vestigios de la época de la investigación de Woody: la atracción de casi solo los blancos por los experimentos, la confianza aparentemente descuidada en el gobierno, el deseo de usar el reconocimiento facial para discriminar por motivos raciales, todo esto es inherente al mundo moderno del reconocimiento facial.

En las pruebas de 2019 del software Rekognition de Amazon, 28 jugadores de la NFL fueron identificados por error como criminales. Unos días después, la Unión Estadounidense de Libertades Civiles presentó una demanda ante el Departamento de Justicia de EE. UU., El FBI y la Administración de Control de Drogas por información sobre el uso de la tecnología de reconocimiento facial de Amazon, Microsoft y otras empresas. Un informe de 2019 del Instituto Nacional de Estándares y Tecnología, que probó el código de más de 50 desarrolladores de software de reconocimiento facial, dice que los hombres blancos tienen menos probabilidades de ser emparejados con delincuentes que otros grupos. En 2018, un par de científicos lanzaron fuertes críticas: "Creemos que la tecnología de reconocimiento facial es el mecanismo de vigilancia más peligroso jamás inventado".

En la primavera de 1993, debido a una enfermedad degenerativa de ELA, el habla de Woody se deterioró. Pero continuó enseñando en la Universidad de Texas hasta que su discurso se volvió ilegible. Continuó su investigación en el campo del razonamiento automatizado, hasta que dejó de sostener la pluma. Sin dejar de ser un científico hasta el final, Woody tomó notas de su discurso para rastrear el desarrollo de la enfermedad.

Woody Bledsoe murió el 4 de octubre de 1995. El obituario no mencionó su trabajo en reconocimiento facial. En la foto del obituario, Woody de cabello gris está mirando directamente a la cámara, con una amplia sonrisa en su rostro.

Comentario de Elena Gerasimova, directora de análisis y ciencia de datos en Netology

Las ideas de Woody Bledsoe no tuvieron éxito comercial, quizás porque su tiempo cayó en uno de los "inviernos de inteligencia artificial". Había poca confianza en las tecnologías, no había suficiente capacidad para demostrar resultados impresionantes, y las tecnologías para reconstruir el cerebro humano fueron utilizadas principalmente por entusiastas: el académico Andrei Nikolaevich Kolmogorov, el matemático estadounidense George Tsibenko y otros.

Sin embargo, gracias a esta investigación, se han hecho posibles avances modernos, que se basan en una poderosa potencia informática, nubes, microchips.

En 1998, Yang LeCun perfeccionó los enfoques para reconocer números escritos a mano en su LeNet, gracias a la evolución de la potencia informática que no estaba disponible durante la investigación de Woody Bledsoe.

La tecnología de reconocimiento facial limita con la tecnología de generación de rostros más avanzada, que se utiliza, por ejemplo, para crear deepfakes y generar rostros de adultos y niños, así como de perros y gatos. Parecería que es más fácil: tomar una foto de una persona y cargarla, condicionalmente, en un catálogo de ropa electrónico; o grabe un video lindo con un bebé y juguetes; o enseñar a una red neuronal a crear una imagen de un niño en ropa, interior o con un juguete que planeamos colocar en el catálogo y así demostrar? La respuesta vendrá motivada por la cantidad de inversión en empresas que desarrollan tecnología para crear imágenes fotorrealistas: solo en los Estados Unidos en 2019, la inversión total ascendió a más de $ 500 millones.

Generación de imágenes fotorrealistas de personas

Si está interesado en trabajar con datos, redes neuronales, le sugerimos que se familiarice con nuestros programas, cuya formación se basa en una base científica e investigación:

Profesión " Data Scientist ". Premio " Quality Mark " en la nominación "Formación de Profesionales de la Industria Digital" (2019).
Curso de Deep Learning . En la página de inicio del curso, puede ver ejemplos de proyectos dentro del curso y ver cómo va la capacitación.

Y para aquellos que buscan enfoques para la implementación de inteligencia artificial, aprendizaje automático y "reinicio digital", sugerimos consultar la información del curso " Transformación empresarial: la introducción de la inteligencia artificial ". Los estudiantes crean una estrategia para la implementación de inteligencia artificial y resuelven casos de negocios reales bajo la guía de expertos extranjeros y rusos.

Tecnología de reconocimiento facial: una historia secreta

: