Foto: Brian Merchant (Gizmodo)
“Der Auftritt von PAI ist, das hauptsächlich aus einer Benutzer-spezifischen Gesicht Modell” Harvilla erklärt, fügte hinzu, dass “jetzt eine Allgemeine Körper Form verwendet wird, in allen PAIs, aber Dinge wie Höhe, Gewicht, Körper-Typ und Kleidung können angepasst werden, indem der end-Benutzer.” Der PAI die Rede, inzwischen wurde aus dem “user-spezifische voice-Modell”.
Beide Modelle werden mit einem machine-learning-Prozess, der als “Anpassung”, oder “fine-tuning” Harvilla sagt. “Zur Erstellung der 3D-Kopf von einem PAI, eine so genannte Basis-Modell gewählt ist, die am ehesten repräsentiert den Benutzer Auftritt. Das Basis-Modell ist dann angepasst an den jeweiligen Benutzer; die Adaption fängt die Nuancen der Gesichts-Struktur und das Aussehen, die Lücke zu schließen zwischen der Basis-Modell und die voll Vertreter PAI.”
“Stimme, die die Erstellung des Modells folgt eine ähnliche pipeline”, sagt er, “bei dem eine bestimmte Sprache Basis-Modell gewählt ist, und aus der relativ kleinen Stichprobe von audio-Aufnahmen der Benutzer -, fein-abgestimmt, spiegeln Eigenheiten des Benutzers Stimme.” ObEN die neuronalen Netze können derzeit eine Stimme zu geben, PAIs sprechen Englisch, Chinesisch, Japanisch und Koreanisch. “Sowohl Technologie-Suiten”, Harzilla versichert mir, “nutzen Sie state-of-the-art-deep-learning-algorithmen.”
Für mich, der Prozess der Erhebung meiner AI-freundlich-avatar hat ein paar Wochen gedauert, obwohl ObEN damit beschäftigt war, finishing verschiedene Projekte, und ich bin mir nicht sicher, wie viel von einer Priorität machen eine verrückte singende high-res-avatar für einen Journalisten war. Habe ich nicht erwähnt, mein PAI wurde noch singen?
“Ich begann diese Firma,” ObEN ist Geschäftsführer Nikhil Jain sagt, “als ich merkte, ich war sehr viel unterwegs und meine Kinder fehlten mir wieder nach Hause.”
Jain und ObEN co-Gründer Adam Zheng, ObEN, COO, beide waren Veteranen der tech-Industrie, und Sie würden es finden sich oft darüber reden, wie Sie Häufig Reisen für die Arbeit, so dass zu wenig Zeit für Ihre Kinder. Das paar auch Häufig fanden sich in der Diskussion der Entstehung von KI-Technologie und die zunehmende Personalisierung von AI, und es scheint, die Themen converged, und die Idee von PAIs materialisiert.
“Ich dachte—was ist, wenn meine Kinder hatten meine PAI zurück nach Hause?” Jain sagt. Dass die Art und Weise, seine Kinder, könnte die Interaktion mit einem avatar, sah, hörte, und benahm sich wie Ihr Vater, während er Weg war, für Tage oder Wochen zu einer Zeit.
Als Jain und Zheng Suche nach Finanzierung, obwohl die Anleger deutete Sie in Richtung der entertainment-Raum. Chinesische tech-Konglomerat Tencent, die einen erheblichen Teil ObEN, $23,7 Millionen in Finanzierung, schien besonders daran interessiert, die fahren ObEN in Richtung Promi-PAIs. Also ObEN angefangen targeting der entertainment-Industrie.
“Wir haben die Technologie,” Jain sagt, “dachten wir, ‘wie bekommen wir diese aus, um ein neueres Publikum?’” Jain sagt. “Und wir dachten, der beste Weg, um das heraus zu erhalten war mit der Leistung von prominenten. Durch diese Investoren konnten wir ein team mit den Spice Girls von China.”
Jain bezieht sich auf SNH48, eine massive “idol-Gruppe” in der j – oder k-pop-Form, gefüllt mit rotierenden Mitgliedern, wobei der 20-jährige Sänger gemeinsam auf und Holen Sie sich gewählt aus. (SNH48 selbst ist im wesentlichen eine massive Start; nach Quarz, Investoren gedumpten mehr als 150 Millionen US-Dollar in das venture, das wirklich auf den Weg nach China verboten koreanische entertainment-Importe nach der benachbarten nation begann den Bau einer Raketenabwehr-Schild. Die Welt ist ein merkwürdiger Ort.)
Unabhängig davon, Tencent vermittelte einen deal gesehen, dass ObEN erstellen PAIs für eine SNH48 die neuen songs und die dazugehörige Musik-video. Es war eingeläutet, als “das weltweit erste kommerziell veröffentlichte song co-starring menschlichen Sängern und Ihren 3D-KI-Avatare,” wenn es ausgestrahlt im Dezember 2018.
ObEN entwickelt PAIs für die pop-stars, die könnten sowohl sprechen (in mehreren Sprachen, nicht weniger) und singen—und das Taten Sie auch. “Unsere AI nimmt die regelmäßige sprechen, Stimme und wandelt es in der singenden Stimme,” Jain sagt. “Wir wollen es wie eine Turing-test—ist es AI zu singen, oder Sie singen?”
Die PAIs zeigen, bis in das video oben, und Ihre Stimmen wurden aufgenommen in den chorus der single ein weiteres vordergründig zunächst im Bereich des entertainment fokussiert AI.
“Unser persönliches KI-Technologie hat großes potential in der entertainment-Industrie,” Zheng sagte, zu der Zeit. “Sagen wir, Sie haben einen Schauspieler, stars in einem Film. Kann ein Erzeuger will ihn singen das ending Lied, das er ist nicht gut. Wir können seine KI-avatar für ihn singen.”
Weiter ObEN haben zusammen mit der Videoüberwachung für die Frühlings-Gala-Festival, zu Feiern, der Lunar New Year, und das ist, wo die PAI-freundlich-TV-Techniker kam. Also ObEN entworfen hat PAIs für zwei von Chinas großen kulturellen Institutionen, und startete in das Jahr mit einem Knall, verdienen eine schöne Menge der Exposition für Ihre Unterschrift PAI sidekicks. Nun, das Unternehmen versucht, um herauszufinden, was die Menschen vielleicht wollen Sie mit Ihrer PAIs.
Mein PAI, es stellt sich heraus, hat eine bessere Stimme als ich es jemals tun wird.
Persönlich, es ist schwer für mich zu platzieren, wo genau diese Länder in Bezug auf das unheimliche Tal.
Ich fand es zutiefst beunruhigend auf den ersten, dann nur ein wenig komisch, ist dann irgendwie komisch ist, dann lächerlich, dann ein wenig beunruhigend wieder. Es ist also die Wirkung starrte in den Spiegel, während Sie gesteinigt zu lange, wenn die Spiegel wurden ein Bildschirm Unternehmen, die Echtzeit-rendering von Ihrem Gesicht in triple A PS4 game-Kaliber Grafiken. Ich fand es ein wenig schwer zu sehen, und wie von jetzt, ich bin mir nicht sicher, wie viel mehr ich möchte, um zu sehen, PAI-mir. Aber es ist auch nur eine begrenzte clip, ohne Interaktivität, also kann ich nicht wirklich beschäftigen oder zu sehen, was es tun kann.
“Es ist sicherlich nicht menschlich,” Kelly Bourdet, der Chefredakteur von Gizmodo sagte, “Es sieht aus wie ein uncanny valley creep show avi aber man sieht Ihnen näher als jedem anderen Menschen auf der Erde.”
“Deine Augen sind freaking me out”, sagte ein Freund. “Klang ist, zumindest für mich,” sagte ein anderer, “Und Sie sehen, wie Sie versuchte, aber nicht an der audition für eine koreanische Boyband.”
“Wow …. sehr cool… (und ein wenig beunruhigend zugleich.),” meine Mutter getextet, wenn ich schickte Ihr das video. “Ziemlich nah… als ich das erste mal auf das Bild geschaut, ich war nicht sicher, Ob es Sie oder jemand anderes…bis Sie begann zu sprechen und sagte, wer Sie waren.”
Seltsam, es war meine Frau, die am meisten verkauft auf dem rendering. “Wow!”, sagte Sie. “Die Zähne sind seltsam, aber anders als das…”
Das war in etwa was ich erwartet hatte—die meisten einig, dass es aussah, gut genug, so wie ich, und die meisten bekommen einen kick aus der Sache, was genau das ist, was es entworfen wurde, zu tun, denke ich. Aber ich Frage mich, ob man diese Herausforderung PAIs Gesicht ist, dass die uncanny valley unweigerlich scheinen breiter, wenn Sie die Messung Ihres eigenen Gestalt über ihn.
“Für diese Avatare nützlich zu sein, dem unheimlichen Tal hat sich zu übergeben,” Jain sagt. “Die Stimme hat, um irgendeine emotion. Die vier verschiedenen Ausdrücke sind wir in der Lage zu schaffen—Freude, Wut, Trauer—die Hornhaut bewegen, in Verbindung mit, wie sich Ihre Lippen bewegen sich, dies sind die Dinge, die das uncanny valley.”
Aber renderings von unseren eigenen Gesichtern kommen gebündelt mit mehr Unsicherheiten und hang-ups als jede andere, die ich vorstellen möchte, und wir beurteilen Sie und engagieren Sie deutlich skeptischer, mehr hart.
Das ist, warum, vielleicht, einige von ObEN ist der Wettbewerb, wie SoGo, wählt Rendern persönliche Avatare mehr cartoonishly. “Der Unterschied zwischen uns,” Jain sagt, “ist, dass es eine extrem angepasste version von Euch.”
Mein PAI war entschieden nicht ein Beispiel dafür, wie eine typische version Aussehen wird—für eine Sache, die ich kann nicht mit ihm interagieren; er ist im Grunde eine demo, erstellt mit dem Unternehmen s AI und mein training inputs. Für ein anderes, es ist so etwas wie ein premium-Modell. Später in diesem Jahr, ObEN sagt, wird es frei, eine app, mit denen die Nutzer Ihre eigenen niedrigeren Auflösung PAIs durch die Einnahme von smartphone Fotos von Ihrem Gesicht. Diese PAIs wird vor allem Spielzeug; Sie können Ihre digitalisierten mini-selbst in verschiedenen outfits und machen Sie sich selbst tanzen. Es ist ein Weg, Jain sagt, um die Menschen vertraut mit der Idee, dass eine ständige Begleiterin auf der hand. Nun, für Promi-PAIs, und die PAI ObEN für mich gemacht, eine in die Tiefe gehende, manchmal mehrere-Termin Prozess ist notwendig, um eine gute audio-sample.
“Für Prominente ist die Anforderung an eine extrem hohe Auflösung, Jain sagt, “Sie gehen zuerst durch einen 3D-scan, dann vollständiger Sprachaufnahmen. Wir auslagern, arbeiten in einem studio Ihrer Wahl.” Sobald die ObEN team ist zufrieden mit der Probe, es dauert dann ein paar Tage zu generieren PAI.
Für den normalen Anwender jedoch, smartphone-Auflösung zu tun haben. “Von einem selfie können Sie Ihre PAI,” Jain sagt. “Es kann nicht sein, so hohe Auflösung wie Taylor Swift, aber es sah aus wie Sie. Singen mit einer Stimme wie deins. Wir glauben, dass, um Ihren PAI sollte immer frei sein.”
Es ist früh noch, aber die cyberpunk würde zwei potenziell divergierenden Klassen von PAIs hier—high-res, verherrlicht Versionen für die reichen, fremium PAI-Modelle für die plebes, aber ich schweife ab. Apropos cyberpunk, ObEN vorstellt Benutzer bringt diese PAIs in die mall, wo Sie Wechselwirkungen mit mall-PAIs, die digitale concierges gibt. Ihre Lieblings-Promi-könnte pop-up beim betreten der mall, und sagen Ihnen, wo die Jacke ist auf der Suche nach,” Jain sagt, die beschreiben, was könnte eine Szene aus Minority Report. “Jeder Verbraucher kann eine PAI, erhalten das volle shopping-Erlebnis.”

Jenseits commerce, ObEN ist auch das Experimentieren mit medizinischen PAIs, und trat in eine Partnerschaft mit der Georgetown-Howard, den Universitäten Zentrum für Klinische und Translationale Studien (GHUCCTS), und MedStar Health Research Institute zu schaffen, Tara, einen avatar entwickelt, um die Interaktion mit Patienten mit Herz-Krankheit, die auf Ihre Tabletten. Die Institute sind mit der Durchführung eines 5-Jahres-Studie, um zu sehen, wenn die Interaktion mit Tara hilft bei der Verbesserung der Patienten-recovery-Zeiten und die Neigung zur Einnahme von Medikamenten und so weiter. “PAI-überwachen Sie, geben Ihnen Trost,” Jain sagt, “lassen Sie Sie wissen, jemand ist immer da, mit Ihnen.”
“In diesem Fall ist es sehr nicht—es ist eine virtuelle Krankenschwester—sprechen, die durch diese vorgeschlagenen Herzchirurgie oder dass,” Jain sagt. “Es ist die Aufzeichnung der Reaktionen, und es tun können, Folgen ups.” Sie sich auch vorstellen, Lehrer PAIs. “Kinder lernen schneller, wenn der Charakter,” Jain sagt mit einem lachen, “ein cartoon-Charakter und lehrt Sie; meine Kinder respektieren Ihre Lehrer mehr als ich—wenn es war Ihr Lehrer, um mit Ihnen zu reden, und lehrt Sie eine Lektion, die Sie vielleicht mehr erfahren.”
Wenn ObEN hat seinen Weg, und die aktuellen trends—zumindest in China, Korea und Japan—zu beschleunigen, dann können wir bald finden wir uns in einer Welt, geschmückt mit PAIs, die Abgesandte der Zuschauer und Promi-ähnlichkeit, knallend aus unseren Handys, Brillen, Einkaufszentren, Bushaltestellen, desktops.
Es gibt eine Energie in der Firma, dass ich nicht Häufig begegnen, in tech-startups; eine einfache, unbeschwerte gute-naturedness, eine Bereitschaft zu seltsamen Grenzen. Vielleicht ist das in Teil, weil es eines der wenigen Unternehmen, die ich erlebt habe in letzter Zeit, wo ich setzte mich an den Tisch und war der einzige weiße Mann im Raum. Es ist eine vielfältige Belegschaft mit verschiedenen Führung, und unser Gespräch war erfrischend frei von der buzzword-Tropf-Sie ertrinken in über Silicon Valley.
Jain und co erfreuen sich in reden über die theoretischen Verwendungen von PAIs—wie ein Taylor Swift PAI, können die Benutzer Fragen, um zu singen für Sie, oder für biographische Informationen, und Sie reagieren mit persönliche Kenntnisse, die er aus einer lange zurückliegenden Trainingseinheit. Das ist einer, der kam mehr als einmal, und das, und das entertainment-basierte Anwendungen sind immer noch diejenigen, die scheinen am ehesten in Resonanz.
Aber es bringt uns auch zu einer der starker Bedenken, die ich sehen, die sich mit dem hypothetischen Masse Popularisierung mit ObEN Technologie—wer kontrolliert die Gestalt, sobald es draußen in der Welt? Für eine Sache, der Vertrag, die ObEN ins Gesicht-scanner fragte mich, zu unterzeichnen, schien eher lästig ist. Hier ist die öffnungsklausel:
“Ich gebe hiermit zu Oben, Inc, und seine Nachfolger, Rechtsnachfolger und Lizenzen (nachfolgend “das Unternehmen”) das unwiderrufliche Recht und die Genehmigung (ich) Fotos von mir, und (ii) zu vervielfältigen und verwenden der Fotos, meine mimik, Aussehen, Posen und Stimme (“Bilder) für alle gesetzlichen Zwecke und ohne weitere Entschädigung. Unternehmen können das Bearbeiten, ändern, kopieren, auszustellen, zu veröffentlichen und anderweitig zu nutzen diese Bilder, und ich ausdrücklich auf jedes Recht verzichten, zu prüfen oder zu genehmigen, die das Endprodukt bei jedem Bild erscheint.”
Ich bin kein Jurist, aber das scheint mir, dass ObEN würde die eigenen Rechte zu meinem Gesicht und PAI in alle Ewigkeit, und Sie würden auch frei sein Gewinn aus meinem Ebenbild, ohne jemandem zu teilen der Einnahmen. Wenn ich ablehnte, den Vertrag zu Unterschreiben, eine andere rep sagte, es war nicht gedacht, für mich jedenfalls, und wir gingen ohne Sie—ich bin nicht sicher, wer, wenn jemand unterschrieben hat, Weg Ihre digitalen Rechte Gesicht
Für seinen Teil, Jain sagt, “den Aspekt des Gesetzes ist wichtig. Wir arbeiten sehr eng mit Agenturen, um sicherzustellen, dass Ihre PAI wird nur verwendet, um Inhalte zu erstellen, dass Sie in der Kontrolle. Sobald die Daten gesammelt, Sie sind für das Leben. Ihre Ländereien besitzen könnte, PAI und halten Sie es lange, nachdem die person Weg ist.” Er sagt, er nimmt den Datenschutz sehr ernst und ist auf der Suche an der Washington State data storage Gesetze als Modell. Es ist auch, warum er die Erkundung der blockchain, sagt er, als ein Mittel der Speicherung von Daten in einer verteilten Weise.
“Datenschutz ist ein großes Thema für uns”, sagt er. “Weil Sie es zu speichern. Das ist, wenn blockchain kam heraus, als eine praktikable Möglichkeit, zu erinnern, Ihre Daten.” Sie werden auch proaktive Maßnahmen zur Bekämpfung deepfakes, sagt er.
Aber letztlich, es kommt alles zurück zu seinen Kindern. Ich kann nicht davon überzeugt werden, dass meine Kinder wollen würde, um Zeit zu verbringen mit PAI-Vater, oder ich würde wollen, dass Sie. Aber Jain sind.
“Meine Kinder haben unseren Testpiloten”, sagt er. “Der erste war mir einfach zu reden, um Sie dann tanzen auf der couch im AR. Ich erinnere mich sehr deutlich an das erste mal ich versuchte es auf Sie—der Bizarre Teil war nicht zu sehen, Ihr Vater, Sie sah Ihren Vater auf Ihrer hand tanzen. Habe Sie einmal über die überraschung, die Sie liebten es.”