Windows bietet Kunden eine breite Palette an Video- und Audiotechnologien, und Entwickler können sich diese Technologien über umfangreiche APIs zu Nutze machen. In diesem Beitrag werden diese beiden Aspekte der Windows-Medienplattform ausführlich behandelt. Die Windows-Medienplattform wurde sowohl für Desktop-Apps als auch für Apps im Metro-Stil erheblich verbessert. Seit der Veröffentlichung von Windows 7 haben sich Medienwiedergabetechnologien deutlich verändert. Heute nimmt Streaming einen höheren Stellenwert ein, und Urheber möchten ihre Inhalte für eine Vielzahl von Geräten anbieten. Auch die erforderliche Akkuleistung bei Mobilgeräten wurde deutlich verringert. Diese neuen Merkmale, die natürlich auch bei Windows 8 und Windows RT einbezogen wurden, stellten für uns die Chance dar, branchenführenden Support für Kunden und Entwickler bereitzustellen. Dieser Beitrag wurde von Scott Manchester verfasst, Gruppenprogrammmanager unseres Media Platform and Technologies-Teams. – Steven


Die Verwendung von „Rich-Media“, gleichgültig, ob Sie sich einen Film ansehen, Musik hören oder einen Videochat führen, zählt zu den unterhaltsamsten und verbreitetsten Aufgaben, für die PCs heute genutzt werden. Ich möchte in diesem Beitrag einige unserer Bemühungen bei der Entwicklung von Windows 8 erläutern, um eine Vielzahl von Multimediaaktivitäten zu ermöglichen und diese Möglichkeiten Drittentwicklern durch eine erweiterbare Medienplattform zur Verfügung zu stellen.

Bei der Entwicklung der Windows 8-Medienplattform haben wir uns insbesondere an den folgenden drei Zielen orientiert:

  1. Leistungsoptimierung. Ziel war eine flüssige und reaktionsschnelle Medienwiedergabe, um die volle Hardwareleistung zu nutzen und gleichzeitig die Akkulaufzeit auf allen PCs bestmöglich auszuschöpfen.
  2. Vereinfachte Entwicklung und Erweiterbarkeit. Ziel war die Bereitstellung einer Plattform, die einfach erweitert und für bestehende Apps angepasst werden kann, um so den Weg für innovative und individuelle Medien-Apps für Windows zu ebnen.
  3. Unterstützung unterschiedlichster Szenarien. Dank der erweiterbaren Plattform mit hoher Leistung und Effizienz können verschiedenste Musik-, Video-, Kommunikations- und andere Multimedia-Apps unterstützt werden.

Unter Beachtung dieser drei Ziele haben wir die Mediendarstellung auf der Windows-Plattform neu gestaltet.

Schnellere, reaktionsfähigere Mediendarstellung

Die Leistung ist stets ein zentraler Aspekt hinsichtlich der Benutzerfreundlichkeit, in Multimediaszenarien ist dies jedoch besonders wichtig. Videos müssen in Echtzeit wiedergegeben werden, die Unterhaltungen sollten ohne Verzögerung erfolgen, und alle diese Aufgaben sollten möglichst wenig Akkulaufzeit in Anspruch nehmen.

Leistung wird in Bezug auf die Dauer, die Computerressourcen und den Speicher gemessen, die eine bestimmte Aufgabe auf einem System beansprucht. Sämtliche dieser Werte sollten so weit wie möglich verringert werden. Unsere Hauptzielsetzung in Bezug auf die Medienleistung lag auf den Bereichen Audio- und Videowiedergabe, Transcodierung, Codierung sowie Medienaufzeichnung.

Effizientes Decodieren von Videos

Wir arbeiten gemeinsam mit Partnern in der Chip-Branche an verbesserten Akkulaufzeiten bzw. einem geringeren Energieverbrauch, um neue und schnellere Medienszenarien umzusetzen. Mit Windows 8 auf Windows 8-zertifizierten PCs kann die Videodecodierung verbreiteter Medienformate auf ein dediziertes Hardwaresubsystem für Medien ausgelagert werden. Dadurch kann die CPU-Auslastung erheblich verringert werden. Dies wiederum ermöglicht eine flüssigere Videowiedergabe und eine längere Akkulaufzeit, da die Decodierung über die dedizierte Medienhardware deutlich effizienter als über die CPU erfolgt. Diese Technologie führt zu Verbesserungen in allen Szenarien, bei denen Videodecodierung erforderlich ist, einschließlich Wiedergabe, Transcodierung, Codierung und Aufzeichnung.

In der folgenden Abbildung ist ein Vergleich der durchschnittlichen CPU-Auslastung unter Windows 7 und Windows 8 bei der Wiedergabe von VC1/H.264-Videoclips (720p Auflösung) und der Vorschau einer Webcam-Aufzeichnung dargestellt.

Vergleich der CPU-Auslastung unter Windows 7 und Windows 8. WMV-Decodierung unter Windows 7: 32 %, unter Windows 8: 14 %; H.264-Decodierung unter Windows 7: 30 %, unter Windows 8: 13 %; Aufzeichnungsvorschau unter Windows 7: 27 %, unter Windows 8: 8 %.

Neben der Videoauslagerung wurden die Verbesserungen bei der Webcam-Aufzeichnung durch einen Wechsel von einer DirectShow Capture-API zur neueren und wesentlich optimierten Windows 8 Media Foundation Capture-API ermöglicht. Außerdem haben wir die Softwareencoder für H.264- und VC-1-Inhalte verbessert, um das Codieren mit der CPU (sofern dies sinnvoll ist) schnell und energieeffizient zu gestalten.

Verbesserte Akkulaufzeit während der Audiowiedergabe

Ein weiteres Beispiel für die Verbesserung der Medienleistung unter Windows 8 ist die Optimierung der Akkulaufzeit (bzw. die Verringerung des Energieverbrauchs) während der Audiowiedergabe. Neben einer möglichen Auslagerung der Audiopipeline (ähnlich zur oben beschriebenen Videoauslagerung) wurde die Pipeline für die Audiowiedergabe grundlegend verbessert, um eine effizientere SteadyState-Wiedergabe zu erzielen. Durch das Zusammenfassen großer Audiodatenblöcke und die Verarbeitung dieser Blöcke zum gleichen Zeitpunkt kann die CPU über 100 Mal länger im Energiesparzustand bleiben (über 1 Sekunde gegenüber 10 ms). Dies ermöglicht eine erheblich verlängerte Akkulaufzeit während der Audiowiedergabe.

Allerdings ist dieser Ansatz nicht für alle Szenarien gleichermaßen geeignet, da durch die erhöhte Pufferung zusätzliche Verzögerungen entstehen. Im folgenden Abschnitt „Kommunikation“ behandeln wir diese Kompromisse eingehender und erörtern, wie der Medienstapel optimal für jedes Szenario angepasst wird.

Die Audio- und Videoauslagerung sind nur einige Beispiele für die Optimierung des Medienstapels unter Windows 8, um eine geringere CPU- und Speicherauslastung sowie eine verbesserte Akkulaufzeit für Desktop-Apps und Apps im Metro-Stil zu erzielen.

Unterstützung unterschiedlichster Medienszenarien

Leistung ist ein zentraler Aspekt der Plattform, jedoch sind die Features, die durch diese Leistung ermöglicht werden, ebenso bedeutend. Unter Windows 8 zählen hierzu etwa die Unterstützung moderner Videoformate, Kommunikationsstreams mit geringer Latenz und eine nahtlose Einbindung externer Mediengeräte.

Kompromisse bei der Plattform

Eine der Herausforderungen bei der Entwicklung einer einzelnen Medienplattform, die für unterschiedliche Szenarien geeignet ist, besteht darin, dass gegensätzliche Ziele erreichen werden sollen. Beispielsweise ist in Kommunikationsszenarien eine geringe Latenz erforderlich, die Codierung und Wiedergabe von Audio und Video, bei der Leistung und Qualität von der Pufferung profitieren, erhöht die Latenz jedoch. In den nächsten Abschnitten erörtern wir diese Herausforderungen im Kontext einiger Szenarien, die wir in Windows 8 umgesetzt haben, z. B.:

  • Kommunikation (z. B. Skype, Lync usw.)
  • Videowiedergabe und Unterstützung moderner Formate
  • Automatische Ausrichtung von Video
  • Wiedergabe von Premiuminhalten
  • Nahtlose Audioübergänge
  • Mediendarstellung auf zusätzlichen Bildschirmen
  • Zukünftige Medienfunktionalität

Vereinfachung von Entwicklung und Erweiterbarkeit

Eine wesentliche Gemeinsamkeit all dieser Aspekte liegt in der integrierten Erweiterbarkeit der Multimediaplattform. Aufgrund der Vielzahl unterschiedlicher Anwendungsfälle, Medienformate, Codecs, Schutzmechanismen und Verarbeitungsarten haben wir Entwicklern die Möglichkeit bereitgestellt, ihr Angebot an großartigen Apps und Websites für Windows individuell anzupassen.

Bei der Erörterung der Medienszenarien in den nächsten Abschnitten gehen wir daher auch darauf ein, wie diese Szenarien von Entwicklern und Drittanbietern erweitert werden können. Beschäftigen wir uns also eingehender mit den Szenarien, auf die Windows 8 abgestimmt wurde.

Kommunikation

Die Echtzeitkommunikation auf PCs, insbesondere auf mobilen Geräten, hat in den letzten zehn Jahren erheblich zugenommen. Windows-Benutzer verwenden Dienste wie Skype und Lync täglich für mehrere Milliarden Minuten Audio- und Videounterhaltung. TeleGeography schätzt, dass der Umfang internationaler Gespräche von Skype zu Skype (einschließlich Videounterhaltungen) im Jahr 2011 um 48 Prozent auf 145 Milliarden Minuten angestiegen sind. Wir haben erheblich in die Verbesserung von Audio- und Videounterhaltungen auf allen Windows 8-PCs investiert. Dabei haben wir unsere Anstrengungen auf zwei Bereiche konzentriert:

  • Integriertes Aufzeichnen und Rendern von Medien bei geringer Latenz. Eine geringe Latenz ist für Kommunikations-Apps entscheidend. Daher unterstützt Windows Medienaufzeichnung und -wiedergabe mit geringer Latenz.
  • Unterstützung von HD-Kameras für verbesserte Videokommunikation. Hochauflösende Videos ermöglichen realistischere und ansprechendere Unterhaltungen, weshalb Windows auch HD-Kameras unterstützt.

Bereitstellung von geringer Latenz

Bei Gesprächen mit anderen Personen werden nahezu unmittelbare Antworten erwartet. Daher lautet ein grundlegendes Ziel bei Kommunikationssystemen, die End-to-End-Verzögerung, auch als Latenz bezeichnet, so gering wie möglich zu halten. Beim Entwerfen von Audio- und Videosystemen für die Wiedergabe wird häufig Pufferung sowohl als Schutz vor Störungen durch Verarbeitungsspitzen oder Netzwerkdatenverkehr als auch für die Verringerung des Energieverbrauchs eingesetzt. Allerdings bringt diese Pufferung eine Verzögerung bei Audio und Video mit sich, die vom Empfänger als Latenz wahrgenommen wird. Bei der Entwicklung von Windows 8 haben wir die Medienplattform so entwickelt, dass sowohl wiedergabe- als auch kommunikationsoptimierte Szenarien unterstützt werden. Die Medieninfrastruktur kann zwischen einem Wiedergabemodus (hohe Pufferung, stabiler bei wechselnden Bedingungen) und einem kommunikationsoptimierten Modus (geringe Latenz) umgeschaltet werden.

Gemäß der TIA/EIA 920-Norm darf die unidirektionale Audiolatenz, die ausschließlich auf die Medienverarbeitungspipeline zurückzuführen ist, 100 ms nicht übersteigen, um eine nutzbare Echtzeitkommunikation zu ermöglichen. Vor diesem Hintergrund haben wir die im folgenden Diagramm dargestellte Testumgebung entworfen, um die End-to-End-Latenz der Pipeline zu messen:

Darstellung der Latenz zwischen Sender und Empfänger. Hierzu zählt die Kameralatenz des Aufzeichnungsgeräts, die Latenz in der Aufzeichnungspipeline einschließlich von Aufzeichnungsquelle, Encoder und Netzwerksenke, die Latenz der Wiedergabepipeline einschließlich von Netzwerkquelle, Decoder, Videoprozessor und Renderer sowie die Latenz des Renderinggeräts auf dem Bildschirm oder im Lautsprecher.

Es müssen zahlreiche Komponenten optimiert werden, um eine geringe Latenz zu erzielen

Bei der Videokommunikation wird die Latenz der End-to-End-Pipeline (auch „Glass-to-Glass“) als die Verzögerung gemessen, die auftritt, wenn ein Videoframe von der Kamera erfasst, in ein unterstütztes Videoformat codiert, über die Netzwerkloopback-Schnittstellen gestreamt, decodiert und anschließend durch das Anzeigegerät gerendert wird.

Die folgende Abbildung zeigt das Ergebnis beim Aufzeichnen und Rendern von PCM-Audio, wenn sich die Medienpipeline im Modus für geringe Latenz befindet. Die ersten Spitzen stehen für die Aufzeichnung des Signals am Transmitter, die zweiten zeigen die Wiedergabe am Empfänger. Die Verzögerung zwischen beiden Spitzen beträgt 65 ms; dies liegt deutlich unter dem angestrebten Wert von 100 ms.

Das Diagramm zeigt eine Verzögerung von 65 Millisekunden zwischen Sender und Empfänger bei der Audioübertragung.

Latenz der End-to-End-Pipeline bei PCM-Audio: Modus für geringe Latenz

Im nächsten Diagramm ist ein Vergleich der Pipelinelatenz zwischen wiedergabe- und kommunikationsoptimiertem Modus (Aufzeichnen, Codieren (im H.264-Format), Streamen, Decodieren und Anzeigen eines Videoframes bei unterschiedlichen Auflösungen) dargestellt. Das Ziel liegt bei einer Gesamtlatenz von 145 ms (gemäß TIA/EIA 920 für praxistaugliche Echtzeitvideounterhaltungen) und ist im Diagramm als grüne Linie dargestellt.

Vergleich für VGA, SVGA, 720p und 1080p. In allen Fällen liegt die Latenz im Wiedergabemodus stets über 500 ms, im Modus für geringe Latenz jedoch bei ca. 100 ms – unterhalb des angestrebten Werts von 145 ms.

Videoframes werden mit einer Rate von 30 Frames pro Sekunde aufgezeichnet und in H.264 codiert

Im Wiedergabemodus beträgt die durchschnittliche Latenz der Pipeline etwa 575 ms. Diese Verzögerung ist für eine flüssige Wiedergabe von Videos erforderlich, jedoch für Videokommunikation in Echtzeit ungeeignet. Im Modus für geringe Latenz liegt die gemessene Latenz bei allen getesteten Videoauflösungen jedoch erheblich unter dem angestrebten Wert.

Unterstützung von HD-Videounterhaltungen

Ein weiteres Beispiel für die Verbesserung der Kommunikation auf Windows 8-PCs ist die Unterstützung von HD-Kameras durch das Betriebssystem. Neue Klassentreiber arbeiten transparent mit Apps zusammen, um Unterstützung für HD-Videofunktionen bereitzustellen. Außerdem wird in Kommunikationsszenarien die zuvor erörterte Hardwarebeschleunigung zum Decodieren von Videos verwendet.

Windows 8 bietet eine konsistente, hochwertige, energieeffiziente Medienkommunikation mit Hardwarebeschleunigung auf PCs, die für Windows 8 entwickelt wurden. Im Bereich der Medienplattform haben wir erhebliche Anstrengungen unternommen, um die Pipelinelatenz zu verringern, und durch die Unterstützung von H.264-Kameras können Benutzer HD-Videounterhaltungen mit Freunden und Verwandten führen.

Video- und Audiounterstützung für Apps im Metro-Stil

Unser Hauptziel hinsichtlich der Unterstützung von systemeigenen Medienformaten für Apps im Metro-Stil lautet, dass sich Benutzer und App-Entwickler auf eine konsistent flüssige Wiedergabe auf den unterschiedlichsten PC-Formfaktoren verlassen können, bei der aktuelle Formate in verbreiteten Szenarien zum Einsatz kommen, z. B.:

  • HTML5-basierte Unterhaltung im Web
  • Videos, die mit Smartphones, Kompaktkameras oder AVC-HD-Kameras aufgezeichnet wurden
  • Streaming von Musik, Filmen und Fernsehsendungen von beliebten Diensten

In den folgenden Tabellen sind die Video- und Audioformate mit integrierter Unterstützung für Apps im Metro-Stil aufgeführt. Für den Einsatz mit Apps im Metro-Stil empfohlene Formate beruhen auf intensiven Partnerschaften mit Hardwareherstellern, um eine vorhersagbare Hardwarebeschleunigung auf unterschiedlichsten Formfaktoren und eine konsistente Leistung in End-to-End-Szenarien sicherzustellen, die über die reine Wiedergabe hinausgehen, beispielsweise Aufzeichnen, Streamen und Transcodieren.

Tabelle mit Formaten von Mediendateien und Streams

Windows 8 bietet hervorragende Unterstützung für das MPEG-4-Format, das sich in der Regel aus H.264-Video und AAC-Audio zusammensetzt. In verschiedenen verbreiteten Codecs, einschließlich Divx und Xvid, wird der MPEG-4 Part 2-Standard implementiert. Deshalb können viele dieser Dateien problemlos in Apps im Metro-Stil wiedergegeben werden. Dies gilt auch für aktuelle MOV-Dateien, die auf dem MPEG-4 Part 12-Standard basieren, beispielsweise auf iOS-Geräten aufgezeichnete Videos. Außerdem werden jetzt sowohl fragmentierte MPEG-4-Dateien als auch 2K/4K-Auflösungen unterstützt. Die Wiedergabe von MPEG-2-Videos und DVDs in Windows 8 Media Center wurde bereits erörtert.

Während der Entwicklung von Windows 7 haben wir uns bereits mit der systemeigenen CODEC-Unterstützung in Windows und mit den Formaten beschäftigt, die durch Erweiterungen verfügbar sind. Seitdem hat sich die Branche hinsichtlich CODECs konsistent in Richtung einer kleineren Anzahl klar definierter und weitgehend unterstützter Formate entwickelt, insbesondere H.264 für Videos. Aufgrund unterschiedlicher Aspekte, z. B. in Bezug auf Urheberrechte und Hardwareunterstützung, ist dies auch sehr sinnvoll. Selbst Browser sind mit HTML5 an diesem Übergang beteiligt. Allerdings ist uns bewusst, dass manche Formate aus unterschiedlichsten Gründen bevorzugt werden. Deshalb sollte sichergestellt werden, dass Entwickler von Windows 8-Apps diese bevorzugten Formate verwenden können. CODECs von Formaten, die bei Hobbyanwendern oder einzelnen Entwicklern beliebt sind, z. B. FLAC, MKV und OGG, können als Komponente in Apps im Metro-Stil integriert werden, da die Windows 8-Medienplattform in hohem Maße erweiterbar ist.

Automatische Ausrichtung von Video

Durch die Verbreitung der Videoaufzeichnung mit herkömmlichen Kameras, Smartphones und Tablets können Benutzer Videos im Hoch- und Querformat aufzeichnen – dank der neuen Touchscreen-Benutzeroberflächen gibt es keine „richtige“ Bildausrichtung mehr. Viele Benutzer kennen den Ärger, wenn erst beim anschließenden Betrachten eines aufgenommenen Videos am PC festgestellt wird, dass die Kamera falsch herum gehalten wurde. Aufgrund des festgelegten Video-Scanmusters werden Videos möglicherweise in einer falschen Ausrichtung angezeigt.

Um diesem Problem zu begegnen, fügen einige Kameras inzwischen Ausrichtungsmetadaten in verbreiteten Dateiformaten (z. B. MP4 und ASF) ein, wenn das aufgenommene Video gespeichert wird.

Seitlich gekippte Darstellung eines Bilds ohne Metadatenunterstützung, richtige Anzeige mit Metadatenunterstützung

Zum Sicherstellen der erstklassigen Wiedergabe eigener Videos auf Windows-PCs wurden folgenden Verbesserungen vorgenommen:

  • Unterstützung von Ausrichtungsmetadaten in MP4- und ASF-Videos (VC-1, WMV)
  • Automatische Drehung von Videos mit Ausrichtungsmetadaten bei der Wiedergabe
  • Automatische Drehung von Videominiaturansichten mit Ausrichtungsmetadaten
  • Einfaches Lesen und Bearbeiten von Ausrichtungsmetadaten durch Apps im Metro-Stil mit Videoaufzeichnungsfunktionen

Premiuminhalte

Ein anderer Bereich, auf den wir bei Windows 8 großen Wert gelegt haben, ist die problemlose Wiedergabe von Premiuminhalten. Bisher wurden die meisten im Internet zugänglichen Videos vorrangig von Benutzern erstellt. Inzwischen ist das Wachstum in diesem Bereich jedoch vor allem auf „Premiuminhalte“ zurückzuführen, d. h. auf den Erwerb von Filmen für On-Demand-Streaming oder auf werbefinanzierte Fernsehangebote. Laut IHS Screen Digest werden im Jahr 2012 in den USA 3,4 Milliarden kostenpflichtige Filme online gestreamt (mehr als doppelt so viel im Vergleich zu 2011). Dazu kommen noch mehr als eine Milliarde Filme auf DVD und Blu-Ray.

Für Premiumvideos gelten die gleichen Anforderungen wie für andere Videos, es sind jedoch zwei wesentliche Plattformfeatures erforderlich, um optimale Qualität zu liefern: adaptives Bitratestreaming und Inhaltsschutz.

Adaptives Bitratestreaming

Adaptives Bitratestreaming ermöglicht eine flüssige, reaktionsschnelle Videowiedergabe, da der PC die für verschiedene Netzwerk- und Ressourcennutzungsbedingungen am besten geeignete Bitrate einsetzt. Da die ersten Frames mit einer geringen Bitrate bereitgestellt werden können, um die Pufferungszeit zu verringern und die Reaktionsfähigkeit zu verbessern, werden Start- und Suchzeiten erheblich verkürzt. Wenn sich Netzwerk- oder Gerätebedingungen ändern, kann der PC zur Minimierung der Pufferung oder zur Verbesserung der Videoqualität eine niedrigere bzw. höhere Bitrate nutzen.

Mit den Erweiterungen der Media Foundation-Plattform unter Windows 8 können Apps zur Unterstützung neuer Formate benutzerdefinierte und Medienquellen mit adaptiver Bitrate verwenden. Bei benutzerdefinierten Medienquellen und Streamingprotokollen können auch Hardwareauslagerung und Inhaltsschutz genutzt werden.

Das Windows Azure Media Services-Team erstellt mithilfe unseres Erweiterungsmodells das Smooth Streaming Client SDK für Apps im Metro-Stil. Bei Smooth Streaming handelt es sich um eine Initiative von Microsoft, um hochwertige Inhalte in verschiedenen Bitraten bereitzustellen und Video-On-Demand, Livestreams, lineares TV und Download-and-Play zu ermöglichen.

Inhaltsschutz

Die meisten Internetdienste, die Videos als Premiuminhalte anbieten, verwenden Inhaltsschutz, der oft von den Rechteinhabern vorausgesetzt wird (z. B. von Filmstudios oder Fernsehsendern). Zur Wiedergabe von geschützten Inhalten mit Apps im Metro-Stil stellt Microsoft das PlayReady Client SDK für Premiuminhaltsdienste zur Verfügung. PlayReady unterstützt sowohl Downloads als auch Streaming, und das oben erwähnte IIS Smooth Streaming Client SDK lässt sich problemlos in das PlayReady Client SDK integrieren, um das Erstellen geschützter Streams für Dienstanbieter zu vereinfachen.

Wir sind uns bewusst, dass in der Branche auch andere Inhaltsschutztechnologien verwendet werden. Mit dem Media Foundation-Erweiterungsmodell können, ähnlich wie beim adaptiven Streaming, angepasste Inhaltsschutzsysteme von Drittanbietern zur Videodecodierung mit Hardwarebeschleunigung integriert werden. Wenn ein Anbieter ein angepasstes Streamingformat oder Inhaltsschutzsystem verwenden muss, ist die Integration dieser Technologien ohne Kompromisse bezüglich Decodierungsqualität oder Akkulaufzeit möglich.

Zusammenfassend bietet Windows 8 die Möglichkeit, ein umfangreicheres Angebot an Diensten mit Premiuminhalten bereitzustellen, die Kunden auf ihren Windows 8-Geräten genießen können, bei hervorragender Streamingqualität, schnellem Download sowie einer langen Akkulaufzeit, insbesondere bei Premium-HD-Videos.

Nahtlose Audioübergänge

Aufgrund der Vielzahl an Medienszenarien, die unter Windows 8 möglich sind, war eines unserer Ziele, den Übergang zwischen diesen Szenarien so nahtlos und flüssig wie möglich zu gestalten. Bei der Audiowiedergabe kommt es häufig zu Überschneidungen, beispielsweise wenn ein Musikstreamingdienst läuft und gleichzeitig ein Video abgespielt werden soll. Daher wollten wir eine klare und übersichtliche Audiowiedergabe ermöglichen, bei der einfach und problemlos die gewünschten Inhalten zur richtigen Zeit abgespielt werden.

Unter Windows 8 werden nicht mehr alle Audioinhalte gemischt und der sich daraus ergebende, häufig undeutliche Stream an die Lautsprecher übermittelt. Es ist jetzt möglich, einen Stream anzuhalten, wenn ein zweiter wiedergegeben wird (natürlich nur, wenn dies sinnvoll ist). In den meisten Fällen legt Windows hierbei die Priorität auf den Audiostream der im Vordergrund befindlichen App. Wird die App in den Hintergrund bewegt, wird der Stream leiser. Als Beispiel dient eine Spiele-App: Wenn Sie vom Spiel zu einer anderen App wechseln, möchten Sie nicht mehr die Soundeffekte des Spiels hören. In einigen Fällen ist dies jedoch nicht wünschenswert, beispielsweise wenn Sie Musik im Hintergrund hören möchten, während Sie Ihre E-Mails abrufen oder im Web surfen. Damit Sie den Ton einer im Hintergrund ausgeführten App hören können, wenn dies erwünscht ist, haben wir Streamtypen eingeführt, durch die wiedergegebene Audioarten gekennzeichnet werden.

In der folgenden Tabelle sind verschiedene Streamtypen aufgelistet, sowie Beispiele für den zu erwartenden Inhalt des jeweiligen Streams.

Audiokategorie

Beispielstreams

Hintergrund-
fähig?

Hintergrundfähige Medien

Lokale und gestreamte Audiowiedergabelisten

Ja

Reine Vordergrundmedien

Filme, Spiele

Nein

Kommunikation

Skype, VoIP (Telefonieren über Internet), Live-Chat

Ja

Alarme

Alarme und Klingeltonbenachrichtigungen

Nein

Spiele

Hintergrundmusik eines Spiels

Nein

Spieleffekte

Schüsse, Explosionen, sprechende Charaktere, Soundeffekte (außer Musik)

Nein

Soundeffekte

Bestätigungstöne beim Klicken auf Schaltflächen

Nein

Sonstiges

Standardaudiotyp, empfohlen für alle Audiomedien, deren fortgesetzte Wiedergabe im Hintergrund nicht erwünscht ist

Nein

Mediendarstellung auf zusätzlichen Bildschirmen

In Windows 7 haben wir „Wiedergeben auf“ vorgestellt, das Sie zum Mediendateistreaming von Windows Explorer und Windows Media Player auf unterstützte externe Geräte verwenden können. Unter Windows 8 ist es mit „Wiedergeben auf“ noch einfacher, persönliche Mediensammlungen und HTML5-Medien für andere Geräte freizugeben, die mit dieser Funktion kompatibel sind. Wir wollten mit „Wiedergeben auf“ eine funktionell umfangreiche, soziale Umgebung für persönliche Inhalte erstellen, um Fotos mit Freunden und Familie teilen, Musik für Partys streamen oder benutzergenerierte Videos aus dem Internet ansehen zu können. Das vollkommen neue Design zielt darauf ab, eine enge Integration von HTML5 auf bestehenden Websites und Ihrer persönlichen Mediensammlung zu ermöglichen, unabhängig davon, ob sich diese in der lokalen Bibliothek eines Windows-PC oder -Tablets, auf einem anderen Computer zu Hause, auf einem Netzwerkserver oder auf einem Webserver in der Cloud befindet.

„Wiedergeben auf“ ist einfach verständlich und ermöglicht eine konsistente, hochwertige Medienwiedergabe bei einer Vielzahl an Apps im Metro-Stil. Einige der Verbesserungen für den Benutzer sind:

  • Verbessertes Setup: In Heimnetzwerken (oder Heimnetzgruppen), in denen die Freigabe zugelassen ist, werden „Wiedergeben auf“-Geräte automatisch erkannt und auf Ihrem PC installiert.
  • Verbesserte Gerätefunktion: Apps im Metro-Stil funktionieren nur mit Windows-zertifizierten „Wiedergeben auf“-Empfängern. Diese Geräte wurden hinsichtlich der Unterstützung moderner Medienformate überprüft, sind DLNA-standardisiert und bieten hervorragende Leistung (einschließlich der überarbeiteten Xbox 360, die noch dieses Jahr auf den Markt kommt). Die Desktopdarstellung, die wir erstmals unter Windows 7 vorgestellt haben, wurde dem Explorer-Menüband hinzugefügt und unterstützt weiterhin alle DLNA-DMR-Geräte.
  • Einfache Erkennung: „Wiedergeben auf“ ist über den Charm „Geräte“ verfügbar. Sie können die Funktion einfach in jeder App starten, die „Wiedergeben auf“ unterstützt. Streifen Sie vom rechten Bildschirmrand nach innen (oder bewegen Sie die Maus in die obere rechte Bildschirmecke), und wählen Sie den Charm „Geräte“ und danach das Gerät aus, auf das Sie streamen möchten.
  • Integriert in IE im Metro-Stil: Mit IE können Sie Musik, Videos und Fotos im HTML5-Format aus dem Web auf Ihre Geräte streamen.
  • Kompatibel mit neuen Musik-, Video- und Foto-Apps: Apps können Fotos aus einer Vielzahl von Quellen sowie persönliche Musik- und Videosammlungen streamen.

Video auf einem Tablet PC im Gerätebereich; das gleiche Video wird auf einem zweiten Bildschirm abgespielt

„Wiedergeben auf“ über die Video-App

Wir haben die Integration von „Wiedergeben auf“ für Apps und Websites von Entwicklern vereinfacht. Diese Funktion ist jetzt für alle Apps im Metro-Stil über den Vertrag für „Wiedergeben auf“ verfügbar. Im Verlauf des Jahres wird die Xbox 360 zur Unterstützung von „Wiedergeben auf“ aktualisiert.

Zukünftige Medienfunktionalität

Windows bietet Unterstützung für die Nutzung neuer Inhaltstypen und erhöhte Flexibilität bei der Inhaltserstellung und Kommunikation. Stereo-3D, Barrierefreiheit und DSP-Effekte sind drei Beispiele für die hervorragenden Multimediafeatures von Windows 8.

Stereo 3D-Videos

Nach dem anfänglichen Hype hat der Stereo-3D-Markt (S3D) in den letzten Jahren in Richtung vollwertiger Kundenprodukte entwickelt. S3D ermöglicht die 3D-Sicht mithilfe zweier sich überschneidender Kopien eines Videos, die aus unterschiedlichen Winkeln aufgenommen und durch eine 3D-Brille als 3D-Video wahrgenommen werden. Unser Ziel ist es, eine funktionsfähige SD3-Umgebung für Windows zu schaffen, und wesentliche Spiel- und Videowiedergabeszenarien auf einer Plattform zu unterstützen, bei der die Details der 3D-Technologie auf dem PC des Endbenutzers keine Rolle spielen.

Unter Windows 8 ist die S3D-Unterstützung über DirectX 10 oder höher und schnelleren GPU mit kompatiblen Treibern verfügbar. Zur Anzeige von S3D-Inhalten ist ein S3D-kompatibler Bildschirm erforderlich. Wir wollten sicherstellen, dass Windows unterschiedlichste Bildschirmtechnologien mit einer konsistenten Benutzeroberfläche unterstützt. Zudem sollte die Entwicklung von Software und Hardware für diese Plattform vereinfacht werden. Durch Grafiktreiber werden bestimmte S3D-Bildschirmtechnologien größtenteils irrelevant, und für Apps mit Stereo-3D steht eine Reihe einheitlicher APIs zur Verfügung.

Die Windows 8-Medienplattform bietet Unterstützung für standardisierte Medienformate für S3D-Video. H.264-Video mit Frame-Packing-Metadaten, die als SEI (Supplemental Enhancement Information) dargestellt werden, ist das für die Onlinebereitstellung typische und daher wünschenswerte S3D-Videoformat unter Windows 8. Die plattformintern unterstützten Frame-Packing-Formate beinhalten sowohl Anordnungen nebeneinander als auch untereinander, wie in folgender Abbildung aufgeführt.

Zwei nebeneinander angezeigte Bilder und zwei untereinander angezeigte Bilder

Windows 8 unterstützt unterschiedliche Stereo-3D-Eingabeformate, einschließlich nebeneinander und untereinander.

Barrierefreie Medienwiedergabe auf der Webplattform

Die Barrierefreiheit bezüglich Medien ist ein wichtiger Bestandteil von Windows, besonders für Benutzer, die auf Barrierefreiheit angewiesen sind.

Untertitel stehen Benutzern zur Verfügung, die erläuternde oder weitere Informationen in schriftlicher Form bevorzugen, die eine Übersetzung in einer anderen Sprache wünschen oder die aufgrund von Hörschwierigkeiten auf eine Mitschrift angewiesen sind.

Videostandbild mit Untertiteln, Videobedienelementen und Untertiteloptionen: Aus / Englisch / Deutsch

Videowiedergabe unter Windows 8 mit Untertiteln

Die Web-Community hat im Rahmen der W3C daran gearbeitet, die bestmöglichen Optionen für die Untertitelung auf allen modernen Webplattformen zu ermitteln. Dazu zählen folgende:

  • Das <track>-Element kann Untertitel für das HTML5-Videotag beinhalten. Diese Funktion ist in Windows 8 nun enthalten. Untertitelunterstützung ist über das Videotag in IE10 und für Apps in HTML verfügbar.
  • Benutzersteuerelemente stehen über die Standard-Mediensteuerelemente des Videotags zur Verfügung.
  • Die häufig in der Web-Community und von Partnern aus der Film- und Fernsehbranche verwendeten WebVTT- und SMPTE-TT-Formate werden systemeigen unterstützt.
  • Die Windows 8-Medienplattform bietet Unterstützung für mehrere Audiospuren innerhalb einer Medienquelle. Benutzer können sich Audiotitel in ihrer bevorzugten Sprache anhören, und die Spuren können auch für Audiobeschreibungen für sehbehinderte Nutzer verwendet werden. Apps im Metro-Stil können nun einfach zwischen Audiospuren wechseln und sogar mehrere Audiospuren gleichzeitig wiedergeben, zum Beispiel die normale Audiospur zusammen mit einer Beschreibung.

Standard-Videosteuerelemente und Sprachoptionen: Englisch, Hindi, Chinesisch, Polnisch

Videowiedergabe in Windows 8 mit mehreren Audiospuren

Hinzufügen von Effekten zur Medienpipeline

Die Windows 8-Medienplattform wurde hinsichtlich einfacher Anpassungsmöglichkeiten entwickelt. Eine dieser Möglichkeiten sind Effekte (häufig digitale Signalverarbeitung oder DSP genannt), die der Pipeline hinzugefügt werden können. Es sind mehrere integrierte Effekte enthalten, zum Beispiel Bildstabilisierung und horizontales Spiegeln (hilfreich für die Webcamvorschau). Apps mit angepassten Effekten können problemlos in die Media Foundation-Pipeline eingefügt werden. Zusätzlich haben wir sichergestellt, dass Mediendaten durch die Pipeline effizient übertragen werden, wodurch der Einfluss auf Leistung und Laufzeit von hinzugefügten DSPs minimiert wird.

Zusammenfassung

Die Windows 8-Medienplattform wurde für eine flüssige und reaktionsschnelle Mediendarstellung mit hervorragender Akkulaufzeit entwickelt. Wir haben Windows entwickelt, um Ihnen eine großartige Benutzeroberfläche für eine Reihe an Szenarien zu bieten, einschließlich Sprachkommunikation, Audio- und Videowiedergabe sowie Streaming. Die Windows-Medienplattform steht auf allen Windows 8-PCs zur Verfügung und entwickelt sich zusammen mit den Medien-Apps weiter.

Abschließend möchte ich Ihnen ein Video zeigen, in dem einige Highlights der neuen Medienplattform erläutert werden.

– Scott


Laden Sie dieses Video herunter, und spielen Sie es in einem geeigneten Media-Player ab:
MP4 in hoher Qualität | MP4 in niedriger Qualität