Gordian Braun: "Vielleicht können wir Gedanken auslesen"
Shownotes
KI-Stimmen klingen längst nicht mehr nur nach Roboter im Callcenter – sie synchronisieren Filme, erzeugen Musik und könnten bald unseren Kundenservice übernehmen. Gordian Braun Growth Lead Europe von ElevenLabs erklärt, warum Europa bei Audio-KI nicht nur mithalten kann, sondern vorne mitspielen will. Es geht um digitale Stimmen, faire Vergütung, die Zukunft der Synchronbranche - und die Frage, ob wir bald weniger tippen, mehr sprechen oder sogar mit den Gedanken steuern.
Transkript anzeigen
00:00:07:
00:00:19: Ich verstehe zwar kein Wort, aber du klangst erstaunlich flüssig.
00:00:23: Aber auch ein bisschen wie eine Roboter-Version von dir die gerade in Peking Urlaub macht.
00:00:28: Ganz genau Andreas!
00:00:30: Habt ihr unsere Stimmen erkannt?
00:00:32: Wir haben die mal digitalisiert und ja eine chinesische Begrüßung sprechen lassen.
00:00:38: Aber ehrlich gesagt, ich fand meine Stimme nicht gut getroffen.
00:00:43: Ja, ich bin auch ein bisschen anderer Meinung.
00:00:45: Ich habe uns zumindest rausgehört.
00:00:46: irgendwie geht besser vermute ich, aber das ist wahrscheinlich auch Ansichtssache.
00:00:52: Das war jetzt eine schnelle Version bei der man nur wenige Sekunden oder Minuten als Vorlage braucht um eine Stimme zu digitalisieren.
00:01:00: Bei der Profi-Variante muss man ja mindestens dreißig Minuten in hoher Qualität vorlegen und dann dauert es auch Stunden bis die Stimme digital vorliegt.
00:01:08: Aber den ersten Versuch fand ich zumindest schon mal lustig.
00:01:12: Jetzt kann man sich die Frage stellen, warum machen wir das überhaupt?
00:01:15: Unser heutiger Gast ist Gordian Braun.
00:01:17: Er ist Growth Lead Europe bei Eleven Labs.
00:01:19: Das ist das unternehmen, dass gerade, kann man vielleicht sagen, die Art und Weise revolutioniert wie wir Filme synchronisieren oder auch Games vertonen oder eben halt auch solche Dinge in einer anderen Sprache vorlesen lassen zum Beispiel mit der eigenen Stimme.
00:01:38: Ja, Gordon ist sehr in Gründer hat siebzehn Jahre Start-up Erfahrung auf dem Buckel und erzählt uns ja heute warum.
00:01:43: Evelen lebt eigentlich ein europäisches Unternehmen ist also ein europaisches Herzrat und aber global.
00:01:49: eigentlich glauben wir schon oder denken Sie auch alles dominieren?
00:01:53: Wir klären auch ob die Arbeit nur noch mit Computern sprechen statt zu tippen Und ob Synchronsprecher noch eine Zukunft haben in Deutschland.
00:02:01: Aber vielleicht gibt es ja auch was Positives.
00:02:02: lasst euch überraschen.
00:02:04: Genau, bevor wir Gordian jetzt hören und natürlich auch nur mit seiner echten Stimme.
00:02:09: das nochmal die übliche Bitte wenn euch das gefällt was wir machen dann folgt uns empfiehlt uns weiter und lasst uns auch gerne eine Bewertung da.
00:02:18: Und jetzt viel Spaß!
00:02:24: Herzlich willkommen bei So Tech Deutschland dem Tech Podcast mit Frau Geholzmeier und Andreas Lauckert.
00:02:36: Hallo,
00:02:41: hallo.
00:02:42: Ich stelle dich ganz kurz vor damit ungefähr im Bilde sind.
00:02:47: Du hast schon eine recht lange Karriere auf die... oder zumindest viele Karrierestationen, sagen wir mal so, auf die du zurückschauen kannst.
00:02:53: Hast ne Banklehre
00:02:55: gemacht
00:02:56: mit IHAC Zusatzqualifikation aber später noch nen MBA an der Baylor University bis da auch in ein Start-up Accelerator Accelerater aufgenommen wurde denn bist auch Seriengründer geworden mehrere Unternehmen gebracht in Deutschland und den USA.
00:03:15: Hast auch eines verkauft, arbeitest hast als Digital Transformation Berater gearbeitet zum Beispiel für BMW warst auch im Private Equity Sektor schon unterwegs und bis jetzt heute seit Juli twenty-fünfundzwanzig also noch gar nicht allzu lange.
00:03:33: Growth Lead Europe
00:03:35: finden bei Eleven Labs so mal in Kurzform
00:03:40: Alles okay, ja.
00:03:41: Das stimmt so ungefähr!
00:03:43: Aber jetzt mal die Frage... Du bist ja bei Elefneeps jetzt bei einem großen Unternehmen und dann noch angestellt?
00:03:51: Für mich jetzt werde ich sagen, Mensch warum nicht was Eigenes?
00:03:53: Ich glaube du hattest auch eine eigene Idee in der Richtung aber...?
00:03:56: Ja also zum einen wir sind natürlich ein großes Unternehmer aber eigentlich sind wir ziemlich klein.
00:04:01: Wir haben momentan noch unter vierhundertfünfzig Mitarbeiter und haben damit einfach nur wahnsinnig viel Umsatz pro Mitarbeiter.
00:04:09: Und sind eines dieser Unternehmen halt diese AI getrieben, logischerweise wir sind ja ein AI-Unternehmen.
00:04:15: Das heißt man kann hier sehr unternehmerisch tätig sein.
00:04:18: Eines der Gründe warum ich bei Lab & Labs bin ist weil ich mir hier weitest gehen mein Unternehmer ausleben kann.
00:04:28: Ich mit der Verantwortung den die ich habe über den europäischen Markt und mittlerweile auch ein paar andere Märkte sehr unternehmerisch tätig sein kann.
00:04:36: Und zum zweiten, das ist vielleicht das andere was du gesagt hattest, dass ich selber mal so eine Idee hatte.
00:04:42: Damals ging es um die perfekte Lippen-Synchronisierung von Filmen und Eleven Labs ist ironischerweise auf die genau gleiche Art entstanden und deswegen kann ich mich auch sehr damit identifizieren was Eleven Labs denn so antreibt.
00:04:56: Auf die Idee müssen wir noch einmal eingehen aber vielleicht umreißt sie nochmal kurz in zwei drei Sätzen?
00:05:00: Was macht Eleven Labs konkret für alle die das vielleicht noch nicht somit bekommen haben
00:05:04: Genau, also ElevenLabs ist ein europäisches Unternehmen mit Hauptsitz in London umsprünglich gegründet in Polen und der Marktführer was alles mit Audio-KI zu tun hat.
00:05:16: Ihr müsst euch vorstellen dass wir kennen ja alle ChatGPT oder OpenAI das ist alles sehr textbasiert.
00:05:22: und wir sagen eben die Zukunft von aller Art von Interaktion mit Computern ist nicht mehr Text basiert oder Eintippen basiert sondern Audio und Sprach basiert.
00:05:31: Und dort sind wir eben der weltweite Marktführer für alle audiobasierten KI-Modelle.
00:05:38: Ja, und eines der schnellst wachsenden Unternehmen Europas.
00:05:41: Europa kann doch KI!
00:05:43: Wir hatten letzte Woche beim letzten Folge CoA war zu Gast hier.
00:05:47: die Agenten machen also Video und natürlich viel über Audio vor allem die Realtime Variante.
00:05:56: vermute mit euch haben wir gar nicht gefragt wenn die nutzen.
00:05:59: aber ich gehe mal davon aus weil ihr seid der marktführer glaube ich wie groß war der schritt dahinten dieses dieses audio tool was ja darauf basiert.
00:06:08: Ich gebe irgendwas der k i die muss das übersetzen die muß das umwandeln die muss wieder zurück wandeln in audio und dann alles übers netz und, dass ist nicht ganz trivial.
00:06:18: ne also dafür musst du schon sehr sehr gute researcher haben wahnsinnig großes Team, was unterschiedlichste Modelle zur Verfügung stellten.
00:06:26: Also wenn wir Audio hören dann denken wir halt an Stimmen oder manchmal auch Sounds oder Musik.
00:06:32: aber im Grunde genommen gibt es so viele einzelne KI-Modelle die unterschiedlichsten Bereiche abdecken.
00:06:37: das fängt an mit der Transkription von Text hört auf mit der Übersetzung von Text in Sprache nennt man Texture Speech und Speech to Text Modeller Und alle Modelle die da irgendwo dazwischen sind Soundeffekte Turn-Taking, das heißt wenn wir dual.
00:06:54: also wir haben jetzt eine normale Konversation und du könntest mich jetzt problemlos menschlich unterbrechen.
00:06:59: Und wenn wir das abbilden wollen mit einer KI dann brauchen wir sogenannte turn taking Modelle.
00:07:04: Das heißt mittlerweile über die jetzt dreieinhalb Jahre die wir existieren als Unternehmen haben wir uns Dutzende von KI Modellen aufgebaut Die alles machen von Geräuschfiltern über Text Output über Sprache über Agenten die deinen Kunden Support ablösen können usw.
00:07:20: Ich würde gerne nochmal auf diese Ursprungsidee kommen.
00:07:23: Also es ging euch darum, also dir als auch dann den Gründern von Eleven Labs Synchronisationen von Filmen besser zu machen.
00:07:32: Ich vermute mal du hast jetzt nicht so wahnsinnig viele Freunde speziell in Deutschland gemacht mit so einer Idee oder Aussage und wenn sie öffentlich gemacht wurde war gerade der deutsche Synkron oder die deutsche Synchronenleistung gilt, soweit ich das weiß ja eigentlich als sehr gut und wegweisend.
00:07:49: Und da gab es ja auch zuletzt immer wieder Kampagnen, die vor allem gegen KI generierte Synchronisation sich richten weil die Emotionen etc.
00:08:02: aus der Sicht der Synchronsprecherinnen und Sprecher weggeht.
00:08:06: Also hast du da schon einen Austausch gehabt.
00:08:09: und was genau hat dir nicht so richtig gefallen an der Synchronisation?
00:08:14: Bei mir selber, bei meinem persönlichen Projekt damals, Dubstage East, das hat mich ja lange existiert.
00:08:19: Das war Teil von unserem Incubator Accelerator-Programm.
00:08:22: Jedenfalls damals war es so dass dort gerade Squid Game auf Netflix rauskam.
00:08:27: Das ist eine koreanische Sendung ist wahrscheinlich natürlicherweise schwerer zu übersetzen und perfekt Lippen zu synchronisieren.
00:08:36: Und als ich jemand, der sehr lange in Amerika gewohnt hat und es nur gewohnte immer amerikanische Filme zu gucken war auf einmal dieses... Es wäre gar nicht auf Deutsch sondern das auf Englisch zu gucken, war schmerzhaft!
00:08:47: Das hatte mich damals zu dieser Idee gebracht.
00:08:50: Jetzt stimmt das schon dass die deutschen Synchronensprecher und die Szene in Deutschland besonders gut sind.
00:08:55: Ich glaube wir kennen auch alle Stimmen die sehr eingängig sind.
00:08:59: Er kennen als die eigentliche Stimme des Hauptdarstellers der englischen Variante.
00:09:04: Aber jedenfalls damals war das gar nicht so arg ein Problem, also wir hatten da schon relativ viele Konversationen dann auch nach kurzer Zeit mit Studios und auch mit Leuten in dieser Branche, die das auch oft als Hilfstool gesehen haben und jetzt weiter fünf Jahre später auf Eleven Labs übertragen ist es natürlich auch so dass wir gerne mit diesen Leuten zusammenarbeiten.
00:09:23: Also es gibt sehr viele Synchronsprecher, aber auch Schauspieler die ihre Stimme über unsere Plattform lizenzieren und anbieten.
00:09:30: Und sich so halt multiplizieren können!
00:09:33: Wir haben komplette Studios und Synchronensprecher die mittlerweile ihr Haupteinkommen von Eleventh-Lives beziehen.
00:09:39: Denn das wird natürlich alles vergütet.
00:09:41: Je öfter du genutzt wirst über ein digitales Angebot desto mehr kannst du verdienen.
00:09:47: So kannst du dich quasi selber kluren.
00:09:49: Man muss nicht immer selber hinstellen sondern... Es ist quasi passives Einkommen.
00:09:55: Exakt, du musst einmal ins Nippertuch laden von vier Stunden deiner Stimme in einer schönen klaren Audio-Version und dann wenn du ein bisschen Glück hast wirst du oft verwendet weil du eine sehr attraktive Stimme hast und dann bekommst du ne Vergütung dafür!
00:10:14: Dann werde ich mal das probieren, ob ich meine Stimme nicht verkaufen kann.
00:10:18: Vielleicht
00:10:18: für alle die zuhören oder vielleicht auch für euch beide?
00:10:21: Natürlich gibt es gerade in Deutschland da noch einen großen Bedarf.
00:10:24: Also dann waren sie nicht viele Unternehmen, die gerne populäre Stimmen nutzen würden und die Library ist jetzt noch nicht so voll wie Sie jetzt zum Beispiel auf der englischsprachigen Version werden.
00:10:33: Ja, spannend!
00:10:34: Und ist es dann so theoretisch mal gesprochen dass der deutsche Sprecher für Robert Niro sehr bekannt natürlich entsprechend teurer ist.
00:10:43: Ich kenne nur Gerüchte, aber dass da Minutenpreise von achthundert Euro aufwärts bei guten Sprechern... ich bezweifle das der sich für dreieinfünfzig Jahre gibt in der digitalen Variante.
00:10:54: Da muss er es auch nicht machen!
00:10:55: Aber natürlich kann jeder Sprecher sich entscheiden wie weit er seine Stimme zur Verfügung stellt und zu welchen Konditionen.
00:11:03: Und wie seht ihr das dann?
00:11:05: Es gab ja Diskussion mit Netflix, Netflix hatte wohl Vorschläge in Sachen Synchronsprecher.
00:11:11: Ja dass sie sich quasi eigentlich schon verschenken sollen da gab es ja eine Diskussion wie.
00:11:17: das wirkt ja auch auf euch.
00:11:18: dann also das unterscheiden viele manchmal nicht so wenn ein Mitglied der Branche so agiert und andere anders.
00:11:26: Das Negative kommt ja immer nach vorne, ne?
00:11:28: Ja und das ärgert mich dann persönlich auch immer als der, der für den europäischen Markt mitverantwortlich ist.
00:11:33: denn wir sind ja ein kernauropäisches Unternehmen und ich finde es gibt immer zwei Sichtweisen zu meinen was die amerikaner machen cutthroat und schnell und alles geht immer wahnsinnig schnell aber halt auch ohne rücksicht auf Verluste.
00:11:45: und dann gibts die europäische herangehensweise die oft sehr von Bedenken geprägt Aber doch viel verträglicher Und ich finde, wir als Unternehmen haben das ganz gut geschafft unsere europäische Kultur und Identität nicht zu verlieren.
00:12:01: Wir würden jetzt so ein Netflix-Approach wahrscheinlich nicht machen.
00:12:04: Wenn wir an solche Projekte rangehen... Ich kann jetzt mal zum Beispiel von unserem Audioprojekt erzählen wo man mit KI Songs generieren kann.
00:12:13: Da haben wir bevor wir überhaupt angefangen haben unsere Modelle zu trainieren, haben wir Verträge mit Plattenlabels und Vereinigungen geschlossen um auf deren Daten basierend unsere KI-Bodelle trainieren zu können.
00:12:28: Und das ist natürlich eine ganz andere Herangehensweise, dass heißt ja wollen da natürlich auch nicht so gerne über einen Haufen geworfen werden mit den Vorgehensweisen von den amerikanischen Pontos.
00:12:39: Das heisst wenn ich jetzt jemand macht und sagt okay ich bin sowieso schon Sprecherin oder wäre auch immer
00:12:46: ich
00:12:48: stelle meine Stimme zur Verfügung und hoffe die gut gebucht Gebe ich dann die Rechte ab.
00:12:54: oder wie funktioniert das?
00:12:56: Du behältst die Rechne so lange, wie du auf der Plattform... also du behältest Rechner und bestimmst wie lange du auf dieser Plattform verfügbar sein möchtest.
00:13:02: Und wenn du dann irgendwann mal aus irgendeinem Grund entscheiden solltest dass diese Stimme jetzt nicht mehr die richtige ist oder deine Stimme generell nicht mehr da sein sollte Dann kannst du sie innerhalb der vertraglichen Fristen natürlich auch wieder von der Platform entfernen.
00:13:14: Wie weit sind wir?
00:13:15: Stellen wir das so einiges vor.
00:13:17: Ich arbeite selber auch mit Eleven Labs, ganz interessant was da so abgeht.
00:13:20: Auch Text-to-Speech und so... Aber ich könnte mir vorstellen irgendwann mal kommen wir irgendwann dazu dass sich das Regisseur nur noch seinen Film abgibt und sagt mit inklusive ja Sounds drum herum und Geräusche wird alles automatisiert umgesetzt oder?
00:13:37: Ja also wir sehen uns selber eher als Creator Tool nicht so sehr als Film und Filmmacher Tool.
00:13:42: Aber wenn du jetzt sagen, wir mal in der Marketing Abteilung Arbeit ist und schnell ein Video rausbringen müsst.
00:13:47: Dann hast du schon alle entsprechenden Tools auf der auf der Eleven Labs Crater Plattform mit der Du Videos erstellen kannst, Sound Effekte erstellen kannst, Sound Musik erstellen Kannst Und auch Deine Overlays und Speech-Overs machen Kannst und so in wenigen Minuten wahrscheinlich das Machen Kannst was Dich vorher Wochen gedauert hätte.
00:14:06: und Insofern dass diesem kommerziellen, diesen eher Marketing-Videos und Projekte eingeht ist es dann schon so das du mit Elevenlabs sehr schnell, sehr schnell Projekten umsetzen kannst.
00:14:19: Wie hat es denn funktioniert?
00:14:21: Ich meine ihr seid jetzt echt noch
00:14:23: nicht
00:14:23: alt.
00:14:23: ne paar Jahre erst also keine fünf
00:14:26: dann ja ne?
00:14:29: Knapp vier Jahre.
00:14:32: Also was das momentum waren die richtigen investoren.
00:14:36: also wie hat das funktioniert dass es jetzt so groß geworden ist?
00:14:40: am schluss in der start-up stehe man ja immer über produkt market fit und ich glaube das ist ein klassisches beispiel wo einfach ein sehr starker product market fit ist.
00:14:50: wir reden hier über.
00:14:52: Einfach wahnsinnig viele anwendungsbereiche von stimmen.
00:14:56: kei, Wir haben jetzt ganz viel über Crater geredet und Video Economy usw.
00:15:01: Aber es gibt sehr viele andere Anwendungsbereiche, wenn wir mal darüber nachdenken wie wir eigentlich aufgewachsen sind vielleicht ich in meinem Alter noch mit dem Ende der Schreibmaschine und dem Anfang des Computers Und seitdem kenne ich eigentlich nichts anderes als meine Finger in irgendeinem Keyboard rein zu tippen und hinterfrage gar nicht mehr ist das die natürliche Art und Weise wie wir miteinander agieren oder mit digitaler Hardware agieren sollten Und wir von Elevenlabs halt schon immer gesagt, nein das ist es ja nicht.
00:15:30: Wir sollten eher das nutzen was wir natürlich nutzen wo auch Nuancen mit übertragen werden und das ist einfach die Stimme.
00:15:38: Insofern wenn du dann ein starkes Research Team hast was solche KI-Modelle generieren kann und die Leute dann auf die Ideen kommen was für unterschiedlichste Anwendungsfälle du benutzen könntest, dann skaliert sowas natürlich sehr schnell.
00:15:51: Das ist der Grund warum wir jetzt in diesen vier Jahren Ja, so wahnsinnig schnell gewachsen sind.
00:15:57: Mhm...
00:15:58: Wie ist das bei euch?
00:16:00: Ihr macht ja vielleicht auch Umfragen, Marktumfragen und so weiter bei Kunden oder auch normalen Menschen die da euch nutzen.
00:16:06: Mein Eindruck ist, ich mach viel mit KI, auch mit StimmenKI.
00:16:10: Am Anfang denke ich immer wie geil, ne?
00:16:11: Das ist ja Wahnsinn!
00:16:13: Und wenn man häufiger mit Arbeit gerade professionell stellt, dann muss ich doch noch mal ein bisschen rumbassieren.
00:16:18: Dann hatten wir auch mal eine Umfrage.
00:16:21: Die Atma in der Stimme, die ist zwar cool aber man merkt doch nach zwanzig Minuten anhören die atmet immer an derselben stelle und in einer selben art und weise und so weiter.
00:16:30: also da gibt es dann doch schon irgendwann wenn die leute sich dran gewöhnt haben eine art jetzt merken sie doch auch so ganz so perfekt ist doch nicht wie der menschow ist.
00:16:37: wie nimmt ihr das war und glaubst du dass wir irgendwann wirklich dahin kommen, dass die stimmen k.i schafft wie ein mensch zu klingen also wirklich zufallsbasiert eigentlich art mit jeder mensche ja auch nicht immer dieselbe atmung macht sondern Ja, da sind nur Nuancen drinne die eigentlich das lebendig machen.
00:16:54: Das fehlt so ein bisschen noch ist mein Eindruck.
00:16:56: ich glaube in der letzten iteration da hast du recht wobei jetzt die neueste generation die jetzt seit sieben acht wochen draußen ist wie nennen wir vor drei conversational?
00:17:04: damit hast du zum ersten mal eine stimmk ii die emotion kann die random reagiert das heißt die die auf dich reagieren kann und auf deine deiner einstellungen emotion und ja die auch je nachdem wie du sie prompt ist, auch Sprachbieler machen kann oder ganz unvorhergesehen atmen kann.
00:17:25: Die kann auch husten oder sonst irgendwas im Keyboard tippen und du hörst das.
00:17:29: also wir sind da schon.
00:17:31: aber man muss auch dazu sagen Wir haben gar nicht den großen Anspruch dass das perfekt sein soll im Sinne von Menschen ersetzen.
00:17:38: es ist ja auch ganz schön dass menschen-menschen sein dürfen.
00:17:41: wir haben eher den Anspruch.
00:17:43: der Anspruch Es soll so gut sein Dass Du sehr zufrieden damit bist wenn diese AI zum Beispiel, deine Kundentickets löst oder du mal wieder einen Flug verpasst hast und du jetzt super schnell eine Umbruchung brauchst ohne vierzig Minuten in der Warteschlange zu hängen.
00:17:56: Und dann ist mir das relativ egal ob die drei- oder viermal gleich atmet.
00:18:00: Mir ist es wichtiger sich nicht vierzig minuten in der warte Schlangenhänge.
00:18:04: Ja gut kann ich verstehen.
00:18:05: Du hast eben noch das Thema Musik angesprochen.
00:18:10: was konkret macht ihr da?
00:18:13: Also in einfachsten Worten ist du kannst eingeben In einem Satz was für Musik du generieren möchtest und wir generieren dir die Songs.
00:18:21: Also wenn ich sage okay, ich habe ein Kaufhaus, wenn es noch gibt und will da irgendwie nette Hintergrundmusik haben, die auch Gesang hat oder ich hab... ...oder was ist so der Anwendungsfall?
00:18:31: Oder auf eine Warteschleife oder was ist das so der...?
00:18:35: Genau also wir haben mittlerweile auch eigene.. also nicht eigene sondern wir haben Künstler die eigene Alben mit uns auf Spotify veröffentlichen.
00:18:42: Leute wie Will I Am zum Beispiel.
00:18:44: Also auch bekannte Künstlern.
00:18:46: Also Musik-Kreierung generell ist ein Anwendungsfall, aber natürlich auch im Business Kontext.
00:18:52: Wenn du lizenzfreie Musik haben möchtest für deine YouTube-Videos oder deine Unternehmensvideos... Oder auch meinetwegen die KVs Musik, das ist alles möglich!
00:19:01: Das wäre ja was für Weihnachtsmerk, denn können die licenzfreien Weihnachtsmusik und die geben?
00:19:06: Ihr werdet das nicht glauben.
00:19:07: wir hatten im Oktober hatten wir eine Company Offsite wo die ganze Kompanie zusammengekommen sind und hatten abends so einen Tanz DJ Abend Und den kompletten Abend haben wir nur Hausmusik unserer eigenen generierten Musik aufgelegt.
00:19:20: Dann gibt es aber auch wieder Diskussionen gerade, die irgendwo anders hinführen.
00:19:26: Ich weiß nicht ob Spotify dabei ist... Aber einige ich glaube dieser hat auch gesagt sie geben relativ viel Geld aus und beschäftigen eine Menge Leute um KI-Musik rauszufiltern aus ihren Playlisten.
00:19:37: also dass die überschwemmen KI-Musik überschwemmt wohl gerade die Streamingdienste.
00:19:41: Also siehst du nicht die Gefahr, dass diese Unmengen von generierten Musikern da irgendwas zerstören und die Leute sagen ne wollen wir nicht?
00:19:50: Wir wollen die echten Künstler haben?
00:19:51: Ja natürlich wie mit allem was mit KI oder neuen Medien zu tun hat.
00:19:56: wenn wir jetzt mal die textbasierten KI Modelle angucken.
00:19:59: Dann hat das auch dazu geführt, dass SEO weitestgehend so wie es vorher unbrauchbar war.
00:20:04: Dass du auf einmal eine Hyperinflation an Text-Content hattest im Internet und Google erst mal damit klarkommen musste was den jetzt guter Content ist und was kein Guter.
00:20:13: Und genauso würde ich das machen wir ja auch unterstützen wir da auch Spotify dabei eben nicht zuzulassen dass schlechte Songs oder schlechte Musik oder schlecht komponierte Musik auf Spotify landet.
00:20:26: Deswegen gehen wir ja gerade diesen Weg über die Labels, dass wir entsprechend gute Modelle trainieren.
00:20:31: Ja und dann ist es natürlich an Spotify entsprechend zu filtern wer auf Spotify veröffentlichten können sollte und wer nicht?
00:20:37: Jetzt ist irgendwie Mitte, Anfang Mitte April.
00:20:41: erste Quartal ist um, wenn du so aufs Jahresende schaust.
00:20:45: was sind so?
00:20:46: oder für mir ist auch noch in den nächsten ein zwei Jahre Was sind so die Ziele bei euch?
00:20:51: So Richtung Ende gedacht.
00:20:52: Das ist ja noch ein bisschen hin, aber wir entwickeln uns wahnsinnig schnell im Enterprise-Kaibereich.
00:20:57: Und was meine ich damit?
00:20:58: Das sind vor allem alle Arten von Kundeninteraktionen.
00:21:01: Also wir haben eben diesen Support Case, Use Case ein bisschen beschrieben, aber das kann auch Mitarbeitertraining sein oder Outbound Calls oder Inbound Call beantworten.
00:21:09: Alle Arten wo es vielleicht auch wegen Fachkräftemangel oder weil einfach keine Ressourcen da sind bis ja zu teuer war Menschen dahinter zu schalten.
00:21:21: Und da sehen wir wahnsinnig starkes Wachstum, machen das auch mit großen Playern wie der Deutschen Telekom oder Revolut,
00:21:27: Klaner.
00:21:28: Also ganz großen Unternehmen, mit denen wir Schritt für Schritt den Kundenservice automatisieren.
00:21:34: und ja und da sind wir natürlich bis zum Ende des Jahres ein massives Wachs-Tum und auch als eines unserer größten Geschäfte.
00:21:42: Wenn du jetzt fragst zwei drei Jahre in der Zukunft Ja, dann ist es das was ich gerade gesagt habe.
00:21:47: Digitale Eingabe, das digitale Eengabemedium zu verändern.
00:21:51: Wir wollen nicht mehr dass die Zukunft aussieht, dass wir immer noch in unserer Tastatur rumklimpern müssen.
00:21:55: Außer es macht auch Sinn aber in der Realität ist es vielleicht schöner natürlich interagieren zu können.
00:22:02: Also ihr
00:22:02: macht das Smartphone überflüssig?
00:22:04: Ich stelle mir das vor bei uns in einer Redaktion wenn dreißig Leute in einem Großraumbüro sitzen und alle reden mit ihrem Computer... ...das die Welt möchte ich auch erleben!
00:22:13: Naja, vielleicht ist dann halt was wir mit unseren Modellen angefangen haben, mit Text to Speech und Speech to Text ist es dann halt Thought-to-Text.
00:22:21: Ich glaube das ist das, was uns Start macht!
00:22:23: Wir bleiben dann immer ein starkes Quo aber wer weiß wo wir in zwei drei Jahren sind?
00:22:26: Vielleicht können wir Gedanken auslesen und sie so strukturieren dass du so alles navigieren kannst.
00:22:31: Und das meine ich mit Interaktion.
00:22:33: also interaktionen muss nicht nur unsere gesprochene Stimme sein.
00:22:38: Wie gesagt, wir sind jetzt weit weg.
00:22:40: Ich weiß selber nicht, wo unser Research Team jetzt gerade daran arbeitet in diesen Bereichen.
00:22:46: Aber mit diesen Gedanken kann man ja mal drüber nachdenken was Zukunft so bringt.
00:22:51: Vielen Dank!
00:22:52: Danke schön!
Neuer Kommentar