Vlingo y Nuance esperan que Siri los haga ver “cool”
Todos quedamos asombrados con el lanzamiento de Siri, Si bien el reconocimiento de comandos por voz no es nuevo en los smartphones, ya que se usa en Android, Blackberry y desde hace mucho tiempo atrás en Symbian, en Windows Mobile y en algunos de los últimos modelos de Palm;, por ahora el que parece ganar la batalla es precisamente este sistema avanzado que nos ha mostrado Apple.
Apple tiene tiempo trabajando en esta tecnología y sus antecedentes se remontan desde las betas de ios 5 y de hecho, el nombre del servicio es el mismo que el de la empresa que compro hace algunos años, propiedad de Nuance, por lo que como les decía en el post de la compra de Swype, tiene que ver con este desarrollo. Claro que ahora presenta una evolución mayor, enorme.. porque en ese entonces solo hacía búsquedas por internet empleando comandos de voz.
Lo curioso es que esto no es una idea nueva, ya que históricamente según comentan en 9to5 , fue en 2003, cuando el gobierno de Estados Unidos comenzó un programa de inteligencia artificial que denominó “Asistente cognitivo que aprende y organiza” o programa CALO, financiado por DARPA como parte de su proyecto “asistente personal que aprende”, con el objetivo de construir una nueva generación de asistentes cognitivos que puedan razonar, aprender , recibir y ejecutar órdenes, explicar lo que están haciendo, reflexionar sobre su experiencia, y responder. Este proyecto estuvo vigente hasta finales de 2007 cuando la empresa SRI lo retomó y lo convirtió en Siri.
Esto tal vez significa que la idea la ha retomado Apple y no lo podemos descartar por completo. Lo más interesante o escalofriante para algunos, es que veremos una oleada de Asistentes Personales Digitales futuros (APD o en inglés VPAs), que en palabras de uno de los fundadores de Siri, Norman Winarsk, éstos representan el paradigma de interacción de siguiente generación para Internet que permitirán que interactuamos en una conversación diciéndole lo que se quiere hacer, aplicándolo en múltiples servicios y fuentes de información para cumplir su tarea para lo cual empleará nuestra información personal, aprendiendo nuestras preferencias y revisando nuestro historial para resolver tareas específicas, para desempeñarse mejor a futuro.
GigaOM se cuestiona si Siri llegará a ser usado como el próximo Facetime pero con voz, respecto a que a pesar de ser alabado, no es tan usado o si será más como la App Store o las pantallas tactiles que nos proporcionan nuevas formas de interactuar con nuestros dispositivos. Los partidarios de los programas de reconocimiento de voz y del mercado de los Asistentes Personales Digitales esperan que ocurra lo segundo. Los ejecutivos de las empresas Vlingo y Nuance tendrán que analizar cómo el mercado reaccionará a los movimientos de Apple (o mas bien del iphone 4S) y lo que significará para la industria porque definitivamente su futuro está relacionado con la aceptación de este servicio que los ayudará a crecer… o no.
Vlingo, la empresa pequeña
Vlingo, es una empresa que tiene un producto que presentó este año llamado Vlingo Virtual Assistant y que al ver ls integración de Siri en el Pphone 4S, decidió lanzar gratuitamente su app . Así algunas tareas como revisar el clima o preguntar los restaurantes cercanos eran gratuitas, pero otras como dictar correos electrónicos o textos no lo eran y Siri hace todo esto y más gratuitamente. Considerando que 4 de los 10 millones de usuarios de Vlingo usan ios, tiene mucho por perder al ofrecer servicios que Apple ya está otorgando gratis.
Y aunque parezca malo, el CEO de Vlingo Dave Grannan no lo ve así, ya que considera que hay un mercado significativo para los asistentes virtuales ya que desde su punto de vista, cuando Apple hace algo es un aspecto que hay que considerar y señal de que se va a expandir y eso es bueno para su negocio. Esto les pasó cuando Google anunció los comandos de voz para Android, con lo cual Vlingo ganó usuarios, pero aún así, tomará sus precauciones. A Grannan le preocupa que Apple haya ido demasiado lejos con la interfaz de lenguaje y los usuarios terminen platicando muy coloquialmente con el producto y éste no les pueda responder. Considera que un asistente virtual debe ofrecer dos cosas: un fácil y otra difícil. La fácil debe ser la tecnología de reconocimiento de voz y la difícil es agregar contexto a las palabras dichas y que se interprete lo que el usuario desea. Eso requiere de una máquina semántica e inteligencia artificial que esté continuamente mejorando pero no es perfecta.
Concluye mencionando que si no se guía a los usuarios a poner ciertas restricciones para el procesamiento del lenguaje natural, habrá problemas. Por eso ellos prefieren no llegar al extremo del uso de un lenguaje natural en sus usuarios, pero eso será un punto de equilibrio donde Apple tendrá que orientar sus usuarios.
Nuance, el pez grande
Mientras tanto, Nuance, que es un proveeedor mucho más grande en cuanto a los programas de reconocimiento de voz y de los asistentes virtuales, está muy optimista con la influencia potencial de Apple en la extensa adopción de voz como una interfaz en los móviles y otros productos de consumo. Mike Thompson de la división móvil de Nuance, dice que la empresa tiene actualmente más de 100 millones de solicitudes de transacciones de reconocimiento de voz de su servicio y cree que Apple mostró como el habla puede ser una interfaz importante en los móviles y en los dispositivos de consumo masivo.
Nuance cuenta con Apple como cliente de su software y ya ha trabajado con Siri en el pasado cuando era una empresa independiente pero no mencionaron como es dicha relación actualmente ( de hecho si buscas la empresa Siri te lleva a la página de Apple de este servicio). Lo que mencionó es que cuando Apple aprueba y diseña algo,el resto del mundo lo sigue y ellos esperan que esto traiga mucha innovación en el desarrollo de un lenguaje natural de forma más profunda donde el teléfono responda casi mágicamente.
Esta magia surge a costa del entendimiento de las palabras por el procesamiento del contexto y la conexión con la red. Siri requerirá una conexión a internet no solo para entender el diálogo, sino también para saber los pasos a seguir una vez que reconozca lo que se la ha dicho. Decirle a Siri que le comunique a tu esposa que vas a llegar tarde o que te ayudea a encontrar un restaurante vegetariano en una ciudad determinada, requiere ancho de banda, y esto no es difícil, pero esto no significa que al quedarte solo y sin datos, Siri vaya a conversar contigo.
Esto viene desde mucho antes de 2003. Como lo demuestra este video conceptual de Apple de 1989… http://www.youtube.com/watch?v=9bjve67p33E