Im vergangenen Jahr kursierte ein bestimmter Produktionsfall in KI- und Virtual-Production-Kreisen. Er verdient mehr Aufmerksamkeit von Produzenten, Showrunnern und Herstellungsleitern in Deutschland und Österreich, als er bisher erhalten hat.

Promise, ein GenAI-Produktionsstudio mit Sitz in Los Angeles, hat etwas Konkretes für Harlan Cobens Final Twist gebaut, eine CBS-True-Crime-Serie. Die Produktion erforderte, dass der Moderator in Tatorten steht, die physisch nicht mehr existieren. Nicht vor einem Green Screen mit dahinter komponierten Bildern. In den Räumen, durch sie hindurchgehend, mit dem Raum interagierend, als wäre er noch da. Zehn einzelne Tatorte, alle rekonstruiert aus Archivfotografien.

Was sie gebaut haben, sagt uns etwas Wichtiges — nicht nur über diese eine Sendung, sondern über eine ganze Kategorie von Erzählformaten, die Produzenten jetzt erstmals zur Verfügung stehen.

Was Promise tatsächlich gebaut hat

Die technischen Details tragen die kreative Implikation, daher lohnt es sich, sie genau durchzugehen.

Stufe 1: KI-Upscaling

Sie begannen mit degradierten Archivfotografien von Tatorten — alte Bilder, oft niedrig aufgelöst, manchmal beschädigt. Die Art Material, das normalerweise als Referenzfotos an der Wand eines Produktionsbüros hängt: nützlich für den Kontext, qualitativ viel zu schlecht, um es auf dem Bildschirm zu zeigen.

Upscaling ist ein Verfahren, bei dem ein Machine-Learning-Modell ein niedrig aufgelöstes Bild analysiert und eine höher aufgelöste Version generiert, wobei es Details ergänzt, die das Originalfoto nicht enthält. Das Modell wurde mit Millionen von Bildern trainiert und trifft intelligente Vorhersagen darüber, wie Feinheiten aussehen sollten: Wandtexturen, Holzmaserung, Spiegelungen in Glas. Das Ergebnis ist eine plausible, visuell überzeugende Version in Sendequalität.

Stufe 2: 3D-Rekonstruktion via Gaussian splatting

Promise verwendete Tools von World Labs, gegründet von Fei-Fei Li, einer führenden Forscherin für Computer Vision an der Stanford University. Die spezifische Technik heißt Gaussian splatting, ein Verfahren zur Umwandlung flacher Fotografien in dreidimensionale Umgebungen, durch die sich eine Kamera bewegen kann.

Statt ein 3D-Modell Polygon für Polygon aufzubauen, wie es ein traditioneller VFX-Artist tun würde, erzeugt das System eine Wolke aus überlappenden volumetrischen Elementen, die zusammen einen überzeugenden Eindruck von Tiefe und Raum erzeugen. Was dabei herauskommt, ist eine Umgebung, durch die man navigieren kann — kein einfaches Panorama.

The Difference Machine
Eine Produktionsherausforderung, die hybrides Denken braucht?

Wir arbeiten mit Produktionsfirmen an KI-gestützten Pipelines — von der Entwicklung bis zur Postproduktion.

Gespräch vereinbaren →

Stufe 3: LED-Volume-Darstellung

Ein LED Volume ist eine große, gebogene Wand aus hochauflösenden LED-Panels, die die Darsteller am Set umgibt. Statt einen Green-Screen-Hintergrund in der Postproduktion zu entfernen und digital zu ersetzen, wird die Umgebung in Echtzeit auf der Wand hinter und um die Darsteller herum angezeigt.

Die Darsteller können den Raum sehen, in dem sie sich befinden sollen. Das Licht von der Wand fällt natürlich auf ihre Gesichter und Körper. Die Kamera erfasst Darsteller und Hintergrund gemeinsam, sodass Spiegelungen, Farbtemperatur und Perspektive ohne digitale Korrektur übereinstimmen. Promise verwendete eine Wand mit 16K Auflösung.

Der Moderator konnte durch rekonstruierte Tatorte gehen, die sich räumlich real anfühlten: nicht weil die Räume physisch nachgebaut worden waren, sondern weil KI sie aus Fragmenten generiert hatte und sie in Echtzeit um ihn herum angezeigt wurden.

Promise — Using Hybrid Production to Reconstruct Crime Scenes

Wie man das früher gemacht hätte

Um zu verstehen, warum das wichtig ist, hilft es, durchzudenken, wie ein Produktionsteam dieselbe kreative Herausforderung vor fünf Jahren angegangen wäre.

Physischer Kulissenbau

Man hätte einen Szenenbildner und ein Bau-Team engagiert, um die Räume anhand von Referenzfotos von Grund auf zu bauen. Für zehn verschiedene Tatorte bedeutet das zehn separate Sets oder eine Reihe von Umbauten. Jeder erfordert Recherche, Entwurf, Bau, Ausstattung und zeitgenössisch passende Requisiten. Das Budget dafür ist bei einer True-Crime-Serie, in der die Räume nur kurz als atmosphärischer Kontext erscheinen, kaum zu rechtfertigen. Die meisten Produktionen in diesem Genre würden es schlicht nicht tun.

Drehortsuche

Man würde reale Räume finden, die den Tatorten nahekommen, und sie so anpassen, dass sie den Archivbildern entsprechen. Das erfordert Location-Scouting, Reisen, Genehmigungen und Kompromisse — denn es ist unwahrscheinlich, einen Raum zu finden, der nah genug dran ist, um authentisch zu wirken. Bei Tatorten, die Jahrzehnte zurückliegen, sind die Originalschauplätze möglicherweise abgerissen oder renoviert. Das ist der Grund, warum so viele True-Crime-Dokumentationen auf Talking-Head-Interviews und B-Roll zurückfallen statt auf räumliche Rekonstruktion.

Traditionelle VFX

Ein erfahrenes VFX-Team könnte fotorealistische Räume bauen, aber die Kosten pro Umgebung sind erheblich und der Zeitrahmen lang. Jeder Raum kann Wochen Arbeit mehrerer Artists bedeuten. Für zehn Umgebungen steht ein substanzielles VFX-Budget in direkter Konkurrenz zu anderen Produktionsanforderungen.

Der entscheidende Punkt: Keine dieser Optionen hätte es dem Moderator ermöglicht, physisch in dem rekonstruierten Raum zu stehen und in Echtzeit mit ihm zu interagieren. Ein Darsteller, der den Raum sehen kann, in dem er sich befindet, gibt eine andere Performance als einer, der ihn sich vorstellen muss. KI hat hier nicht einfach Kosten gesenkt. Sie hat eine bestimmte kreative Entscheidung realisierbar gemacht, die vorher im Grunde vom Tisch war.

The Difference Machine. Wie KI Harlan Coben an Tatorte brachte, die es nicht mehr gibt.

Was das für deutschsprachige Produktionen bedeutet

Der Fall Promise demonstriert etwas, das über Tatort-Rekonstruktion hinausgeht. Die zugrunde liegende Fähigkeit ist folgende: Man kann minimales visuelles Ausgangsmaterial nehmen, manchmal ein einzelnes Foto, und daraus eine navigierbare dreidimensionale Umgebung generieren. World Labs veröffentlichte Ende 2025 ein Tool namens Marble, das aus einem einzigen Bild in unter fünf Minuten eine editierbare 3D-Umgebung erzeugen kann.

LED Volumes sind nicht mehr den großen amerikanischen Studios vorbehalten. Sie stehen in London, München, Budapest und Dutzenden weiterer Städte. Der Virtual-Production-Markt liegt 2025 zwischen 2,8 und 3,8 Milliarden Dollar, mit einem prognostizierten jährlichen Wachstum von 14 bis 20 Prozent bis 2032.

Europäische Produktionsfirmen arbeiten bereits mit dieser Pipeline. Paprika Studios in Budapest setzte KI-generierte Illustrationssequenzen für The Ruthless One ein, eine RTL+-True-Crime-Serie über einen ungarischen Mordfall der 1990er Jahre. VG Norway produzierte Norske forbrytere mit KI-animierten Nachstellungen, was 2024 eine Gullruten-Nominierung (Golden Screen) einbrachte.

Der Wettbewerbsvorteil verschiebt sich. Vor zwei Jahren lautete die Frage, ob man überhaupt Zugang zu diesen Tools hat. Heute lautet die Frage, ob man weiß, was man damit anfängt. Bessere KI erzeugt bessere Umgebungen schneller. Sie sagt nicht, welche Umgebung man bauen soll, was die Kamera zeigen soll oder wie sich ein Darsteller durch den Raum bewegen soll. Die Technologie wird zur Massenware. Die kreative Anwendung nicht.

Was die Produktionen unterscheidet, die funktionieren, ist ein klares Verständnis dafür, welche kreativen Entscheidungen die Tools neu ermöglichen — und eine Methodik, um diese Entscheidungen im Dienst der Geschichte umzusetzen. Dieses Fachwissen hat einen Namen. Es heißt Regie. Und es ist der Teil hybrider Produktion, der nicht einfacher wird, wenn die Tools besser werden.

Promise — Reconstructing Crime Scenes: AI VFX Breakdown

Drei Fragen, die sich lohnen

Wenn Sie als Redakteur, Produzent oder Herstellungsleiter zum ersten Mal KI-gestützte Produktion evaluieren, sind dies die Fragen, die durch den Lärm hindurchschneiden.

Stellen Sie zuerst die Formatfrage

Nicht: Welche KI-Tools verwendet dieser Produktionspartner? Sondern: Welche Formate oder kreativen Entscheidungen ermöglicht dieser Ansatz, die vorher nicht realisierbar waren? Jedes Genre hat Entsprechungen: kreative Entscheidungen, die Produzenten historisch aus Kosten- oder Machbarkeitsgründen ausgeschlossen haben und die KI jetzt wieder auf den Tisch bringt. Beginnen Sie dort, nicht bei der Tool-Liste.

Fragen Sie nach der Methodik

Jeder mit den richtigen Tools und ausreichendem Budget kann eine 3D-Umgebung aus einem Foto generieren. Die Frage ist, ob das Team einen systematischen Ansatz hat, um zu entscheiden, welche Umgebungen gebaut werden, welches Detailniveau sie erfordern, wie sie der Geschichte dienen und wie Darsteller mit ihnen interagieren. Das ist es, was eine Technologiedemonstration von einer Serie unterscheidet, die über eine ganze Staffel trägt.

Fragen Sie, was sie bewusst nicht gebaut haben

Wenn man aus minimalem Ausgangsmaterial jede beliebige Umgebung generieren kann, besteht das Risiko, zu viele zu bauen — oder Umgebungen zu bauen, weil man es kann, nicht weil die Geschichte sie braucht. Die beste hybride Produktionsarbeit kommt von Teams, die bewusst Beschränkungen setzen. Fragen Sie, was sie ausgeschlossen haben und warum.

„Die Technologie wird zur Massenware. Die kreative Anwendung nicht."

Die Formatfrage

Die Branchendiskussion über KI in der Produktion wurde von der Technologiefrage dominiert: Kann KI das, was kostet es, ist das Ergebnis überzeugend genug. Diese Fragen waren relevant, als die Tools noch unreif waren. Sie sind heute weniger relevant, weil die Antwort auf die meisten davon Ja lautet.

Promise' Tatort-Rekonstruktionen sind eine spezifische, kleine Antwort auf die wichtigere Frage. Ein Moderator, der durch Räume geht, die nicht mehr existieren, und sie räumlich erlebt, statt Fotos davon zu betrachten. Eine Formatentscheidung, die auf diesem Budgetniveau vorher nicht verfügbar war und die Art verändert, wie das Publikum das Material erlebt.

Die Produzenten, die die nächste Generation von Formaten definieren werden, sind diejenigen, die über diese Frage hinausgehen und fragen: Was war vorher nie möglich? Nicht günstigere Räume. Räume, die nicht hätten existieren können. Nicht die Pipeline. Die Formate, die sie ermöglicht.