Amazon crea una gran alianza a la demanda asistente de voz de compatibilidad

Un día antes de su reunión anual de otoño de hardware evento, Amazon está haciendo una gran asociación anuncio: se ha creado la Voz Iniciativa de Interoperabilidad, que es una especie de declaración de intenciones de más de 30 empresas diferentes que se esforzarán por asegurarse de que los dispositivos funcionan con múltiples asistentes digitales al mismo tiempo. Por ejemplo, usted podría hablar con Alexa o Cortana en el mismo smart altavoz diciendo simplemente el adecuado wake palabra.

«Tanto como a la gente le gustaría que el título que va a ser un asistente de voz que las reglas de todos ellos, no estamos de acuerdo», dice Amazon, VICEPRESIDENTE ejecutivo de dispositivos y servicios de Dave Limp. «Este no es un evento deportivo. Allí no va a ser un ganador.» Cojera sostiene que si siempre habrá múltiples voz asistentes, que deben trabajar juntos.

Una amplia gama de empresas que construyen tanto de software como de hardware para la voz de los asistentes se han adherido a la iniciativa. Yo sólo voy a citar de Amazon comunicado de prensa directamente a dar algunas de las empresas de la lista ya que es claro que Amazon va para algunos conmoción y pavor aquí, especialmente desde la lista incluye algunos de los principales jugadores. He resaltado algunas notables:

Más de 30 empresas están apoyando el esfuerzo, incluyendo marcas globales como Amazon, Baidu, BMW, Bose, Cerence, ecobee, Harman, Logitech, Microsoft, Salesforce, Sonos, el Sonido de los Estados, de Audio Sony de Grupo, Spotify y Tencent; operadores de telecomunicaciones como Libres, Orange, SFR y Verizon; soluciones de hardware de proveedores como Amlogic, InnoMedia, Intel, MediaTek, NXP Semiconductors, Qualcomm Technologies, Inc., SGW Global y Tonly; e integradores de sistemas como CommScope, DiscVision, Libre, Linkplay, Miordenador, Sagemcom, StreamUnlimited y Sugr.

Es una lista muy larga, y tres compañías importantes están ausentes: Google, Apple y Samsung.

Foto por Dan Seifert / The Verge

Las empresas que están en la junta parecen muy contento, si las cotizaciones se han proporcionado por Amazon comunicado de prensa son una indicación. Intel dijo que su 10ª Generación de fichas de trabajo con «múltiples asistentes de este año,» y Qualcomm dijo que sus chipsets son capaces de hacer múltiples wake palabras ya.

Si leemos entre líneas de esta declaración de Andrew Shuman, CVP Cortana de Microsoft, usted encontrará el más suave posible guiño a la forma en que Google y Apple han hecho sus plataformas hostil a terceros asistentes: «esperamos que la iniciativa para ayudar a expandir esta visión a más empresas y a fomentar un ecosistema equilibrado que permite a las empresas crear y hacer sus asistentes, en todas las plataformas.» (El énfasis es mío.)

Más curiosamente, otras empresas parecen ansiosos de obtener sus asistentes de voz en el Eco de los dispositivos. El CEO de Salesforce, Marc Benioff, escribe que «esperamos trabajar con Amazon y otros líderes de la industria para hacer de Einstein de la Voz, el líder mundial en CRM asistente, accesible en cualquier dispositivo.» Mientras tanto, Spotify de I + D oficial es citado diciendo, «Estamos muy contentos de unir la Voz Iniciativa de Interoperabilidad, que dará a nuestros oyentes una más fluida la experiencia a través de cualquiera de asistente de voz que elegir, incluyendo la capacidad para pedir Spotify directamente.» (El énfasis es mío.)

Baidu es la participación es también notable. La empresa de China DuerOS asistente de voz tiene más de 400 millones de usuarios, que es más de Alexa , pero menos que el de Google Assistant. Baidu senderos sólo Amazonas como el segundo mayor fabricante de smart altavoces, según la firma de investigación Canalys, habiendo superado recientemente, Google, a pesar de sólo servir al mercado Chino.

La idea, estas compañías esperanza, es que habrá dos tipos de asistentes. Un tipo va a ser amplio en cuanto a sus conocimientos y capacidades (creo que Alexa, Siri y Google), pero otras serán estrecho y profundo, el contexto específico de su dominio de conocimiento. El objetivo es hacer posible hablar directamente a cualquiera de ellos en un elegante altavoz sin la necesidad de un intermedio de habilidad.

Es una estrategia que ya están jugando en Pc. Amazon, un asistente de voz está más estrechamente integrado en Windows 10, lo que permite bloqueado el Pc para responder a preguntas de carácter general cuando alguien grita «Alexa» lado de la habitación. Microsoft Cortana es ser reorientado en las interacciones con la compañía de software y servicios.

Cojera compara su visión para la voz de los asistentes para navegadores: puede utilizar cualquier navegador que quiere ir a cualquier sitio web que desee, así que ¿por qué no puedes usar cualquier altavoz que desea hablar a cualquier asistente que desea? «Somos una web 1.0 de la compañía,» Cojera dice, «y la razón por la que este edificio existe de que estoy sentado ahora mismo es una función de la interoperabilidad de la web.»

Es una muy alta-mente lo ideal, pero también pueden ser estratégicamente inteligente. Amazon ya cuenta con una sólida posición en el hogar con Alexa, por lo tanto permitiendo que otros asistentes a trabajar en su Eco altavoces no parece un gran problema. Para ser claros, Amazon se ha comprometido a permitir que eso suceda. La compañía ya ha anunciado que los clientes Orange en Francia será capaz de comprar Eco de los altavoces que dan soporte tanto a Alexa y Naranja asistente Djingo.

Siri, y sólo Siri, funciona en el nivel del sistema en el iPhone. Foto por Amelia Holowaty Krales / The Verge

Sin embargo, Alexa tiene no había tenido mucho éxito en los teléfonos, a pesar de varios intentos de alianzas con los fabricantes de Android y de los fabricantes de auriculares. Una gran parte de la industria iniciativa en la que todos participan, excepto los tres compañías más influyentes en los smartphones parece diseñado a medida, para ejercer presión sobre las compañías. (También puede ayudar a Amazon hacer el caso de que no monopolística ya que está tan dispuesto a jugar bien con los demás y abrir su plataforma de voz a los competidores.)

Si usted lo ve como el altruismo o estratégico 4D de ajedrez, la iniciativa puede poner un poco de presión en Google por lo menos. Ha sido más reticente a permitir que Google Ayudante para trabajar con otros tipos de software, aunque tal vez por razones relacionadas con la privacidad, en lugar de la dinámica del mercado.

Cuando se le preguntó específicamente acerca de Google, Apple y Samsung, Cojera dice que «los tres compañías, nos encantaría formar parte de esta iniciativa». Que la hace sonar como ellos han disminuido, pero la Cojera se negó a ampliar eso.

Él dice que a pesar de que ha estado hablando con otras empresas acerca de esta idea durante algún tiempo, fue sólo en el pasado «seis semanas» que se constituyeron en algo más formal. Saber cómo rápidamente (o lentamente, según sea el caso) que empresas como Google y Samsung mover, seis semanas no parece mucho tiempo. Harman es técnicamente una subsidiaria de Samsung y los teléfonos Samsung ya Bixby y Google Asistente simultáneamente, por lo que no está claro por qué no ha firmado. Como para Apple, bueno, no es conocido por ser un carpintero.

Google dio una declaración, señalando que sólo ha escuchado acerca de esta iniciativa durante el fin de semana:

Hemos escuchado acerca de esta iniciativa y sería necesario revisar los detalles, pero en general siempre estamos interesados en participar en los esfuerzos que tienen un amplio respaldo de los ecosistemas y mantener fuertes prácticas de privacidad y seguridad.

Estamos llegando a Samsung y Apple para el comentario.

Para ser claros, Cojera no declarar a la creencia de que esta iniciativa va a poner presión sobre las compañías: «Si ellos no quieren hacerlo, esto no va a cambiar su mente».

Foto por Chris Welch / The Verge

Desde un punto de vista técnico, existen mil y una preguntas acerca de la implementación, software, privacidad, y más que no tenemos respuestas aún. La Voz de Interoperabilidad Iniciativa no pretende ser un cuerpo de estándares, tampoco parece ser prescriptivos acerca de cómo sus miembros deben acercarse a las complicadas cuestiones que rodean la fabricación de un solo altavoz soporte de varios asistentes a la vez.

Amazon está regalando su «wakeword motor» para otras empresas que quieran construir sus propios asistentes pueden utilizar Amazon investigaciones para empezar. Pero las empresas en el consorcio son libres de usar cualquier tecnología que les gusta.

Hasta la fecha, no ha habido muchos dispositivos que pueden «soportar múltiples simultáneas wake palabras.» Facebook del Portal, algunos coches, y un par de teléfonos Android vienen a la mente. Más prominente dispositivos, como el Sonos Uno, hacer que los usuarios elegir entre cualquiera de Alexa o Google Assistant en cada altavoz de la base.

Pero realmente no hay una limitación técnica no. Antoine Leblond, vicepresidente de software de Sonos, hizo una demostración de un Sonos Uno de los oradores trabajando tanto con el «Alexa» y «Hey Google» wake palabras activos para mí más que una llamada de video conferencia el día de ayer. Funcionó a la perfección, incluyendo Sonos la «continuidad», característica que le permite iniciar la música con un asistente de control con la otra.

Traté de localizar a Leblond sobre la razón por la que esta no es la forma en que el Sonos Uno trabaja, como yo en varias ocasiones en el último par de años. Específicamente, dado que Amazon ha afirmado en repetidas ocasiones que está contento de tener Alexa coexistir con cualquier otro asistente, que Google está rechazando es? Leblond objetaron, pero lo hizo traer a colación el hecho de que hay un montón de cosas que podrían ir mal con dos activa de los asistentes en un solo altavoz. Por ejemplo: si se establece una alarma con un asistente y no se cuando se va, ¿tu familia sabe que asistente para decirle que se callara?

Foto por Dan Seifert / The Verge

Averiguar cómo implementar varios asistentes desde un punto de vista técnico no es el problema más grave. Si hay algo que el año pasado nos ha enseñado, es que pocas personas se dieron cuenta de la forma para que la voz asistentes fueron la recolección de nuestros datos. Rolling escándalos que han afectado a Amazon, Google y Apple sobre sus prácticas de humanos, los revisores de control de calidad de las transcripciones. Los tres han cambiado el curso de manera significativa, el aumento de la transparencia y lo que es más fácil para cancelar, borrar sus datos, o ambos.

25 la empresa consorcio queriendo hacer que sea fácil para los múltiples asistentes a coexistir no suena como una gran receta para la privacidad, ya sea. Pero Cojera hace hincapié en que él quiere ser deliberada con la forma en que estos sistemas están estructurados.

Por ejemplo, él cree que debe haber reglas estrictas, donde un asistente que nunca se le permite «escuchar» en una conversación con otro asistente. Que parece simple, pero no son más difíciles problemas. Debe la mayoría de los trabajos involucrados en la escucha de los diferentes wake palabras ser manejado por hardware o software? Cuando Cojera dice que él tiene «voz asistentes [algún día] colaborar en la nube de una forma privada en nombre de los clientes de una manera que preserva el contexto y la continuidad,» ¿de qué manera exactamente de la privacidad que ser asegurado?

Y se pone aún más espinoso: un problema común que durante el año pasado ha sido la constatación de que estos asistentes son accidentalmente grabación sin escuchar a su paso la palabra. Así, en un mundo donde un orador podría haber dos o una docena de diferentes asistentes listo y a la espera, ¿qué sucede con los accidental de las grabaciones?

No hay respuestas claras a estas preguntas, sin embargo, seis semanas después de los debates acerca de la formación de la iniciativa se puso serio, sólo un compromiso a la figuración de ellos. Me preguntó Sonos si hay reuniones o contratos, o incluso de las cuotas, y las respuestas fueron no, no, y no. Es todo muy temprano.

Amazon, especialmente con Alexa, tiene una reputación para moverse rápidamente para ampliar su ecosistema, a veces a expensas de la claridad o de la calidad del software. Sólo pensar en los primeros días (y algunos más recientes) de utilización de las competencias con Alexa, que a menudo requieren peraltado, comandos específicos. Esta vez, al menos, Amazon no parece estar corriendo.

«Tenemos cinco años en esto», Cojera, dice. Cuando se mira en el técnico y los problemas de privacidad aquí, él cree que «es un problema manejable, pero no es un problema trivial. Va a tener muchos, muchos años a solucionar».

Deja un comentario

A %d blogueros les gusta esto: