Die neuartige verlustbehaftete Komprimierungsmethode von Google zielt auf perfekten Realismus mit nur einem einzigen Diffusionsmodell ab |Synchronisiert

2022-07-23 09:49:31 By : Ms. Angela Ding

KI-Technologie und Branchenüberblick56 Temperance St, #700 Toronto, ON M5H 3V5In dem neuen Paper Lossy Compression with Gaussian Diffusion stellt ein Google Research-Team DiffC vor, eine neuartige und einfache verlustbehaftete Komprimierungsmethode, die nur auf einem bedingungslos trainierten Diffusionsgenerierungsmodell beruht und trotz fehlendem Encoder modernste Bildkomprimierungsergebnisse erzielt verwandeln.Die verlustbehaftete Komprimierung ist ein Datenkomprimierungsansatz mit einem Kompromiss: Sie ermöglicht eine hohe Komprimierung, geht jedoch mit einem gewissen Informationsverlust einher, dh die komprimierten Daten werden nicht in ihrem exakten Originalzustand wiederhergestellt oder rekonstruiert.Während dies in vielen realen Anwendungen wie der JPEG-Digitalbildkomprimierung akzeptabel und nützlich ist, besteht in der Community des maschinellen Lernens ein zunehmendes Interesse an der Verbesserung der verlustbehafteten Komprimierungsqualität.In dem neuen Paper Lossy Compression with Gaussian Diffusion zielt ein Google-Forschungsteam auf „perfekten Realismus“ bei der verlustbehafteten Komprimierung, bei der die Rekonstruktionen nicht von den echten Daten zu unterscheiden sind.Das Team schlägt DiffC vor, eine neuartige und einfache Methode zur effizienten Datenübertragung, die nur auf einem bedingungslos trainierten Diffusionsgenerierungsmodell beruht und trotz fehlender Encoder-Transformation modernste Bildkompressionsergebnisse erzielt.Die meisten modernen verlustbehafteten Komprimierungsverfahren umfassen eine Encoder-Transformation, eine Decoder-Transformation und ein Entropiemodell.Das vorgeschlagene DiffC ist ein einzelnes Modell, das isotropes Gaußsches Rauschen direkt zu den Pixeln hinzufügt und die Notwendigkeit beseitigt, eine Codierertransformation durchzuführen.DiffC übermittelt zunächst effizient eine beschädigte Version der Daten vom Sender an den Empfänger und verwendet dann ein Diffusionsgenerierungsmodell, um eine Rekonstruktion zu erzeugen.Durch die Einführung unterschiedlicher Grade von Gaußschem Rauschen kann das Modell flexibel Daten mit beliebigen Bitraten kommunizieren, und die Rekonstruktionen können somit aus einem beschädigten oder unvollständigen Bitstrom generiert werden.In ihrer empirischen Studie führten die Forscher eine Ratenverzerrungsanalyse durch, um ein tieferes Verständnis der Leistung von DiffC zu erlangen.Sie fanden heraus, dass isotropes Rauschen nahezu optimal ist;dass DiffC selbst bei extrem niedrigen Bitraten von etwa 0,2 Bit pro Pixel wahrnehmbar ansprechende Ergebnisse liefert;und dass für höhere Bitraten eine deterministische Rekonstruktion basierend auf der gewöhnlichen Wahrscheinlichkeitsfluss-Differentialgleichung (Song et al., 2021) das traditionelle Sampling aus dem hochmodernen HiFiC (High-Fidelity Generative Image Compression, Mentzer et al. , 2020) Basismodell (+3dB) und übertrifft den nicht-neuralen Bildcodec BPG (Better Portable Graphics).Während die Forscher einräumen, dass der hohe Rechenaufwand von DiffC es in seiner derzeitigen Form unpraktisch macht, zeigt ihre Studie das Potenzial von auf Diffusionsmodellen basierenden Ansätzen zur Vereinfachung und Verbesserung der Leistung von verlustbehafteter Komprimierung mit realistischen Einschränkungen.Das Paper Lossy Compression with Gaussian Diffusion ist auf arXiv.Autor: Hecate Er |Herausgeber: Michael SarazenWir wissen, dass Sie keine Neuigkeiten oder Forschungsdurchbrüche verpassen möchten.Abonnieren Sie unseren beliebten Newsletter Synced Global AI Weekly, um wöchentliche KI-Updates zu erhalten.Maschinenintelligenz |Technik & Industrie |Informationen & AnalysenPingback: Die neuartige verlustbehaftete Komprimierungsmethode von Google zielt auf perfekten Realismus mit nur einem einzigen Diffusionsmodell ab – synchronisiert – AI CaosuoDanke für das Teilen!Diese Website ist sehr informativ.Ich schätze diese Website.Deine Email-Adresse wird nicht veröffentlicht.Erforderliche Felder sind markiert *Benachrichtigen Sie mich über nachfolgende Kommentare per E-Mail.Benachrichtige mich über neue Beiträge per E-Mail.56 Temperance St, #700 Toronto, ON M5H 3V5One Broadway, 14. Stock, Cambridge, MA 0214275 E Santa Clara St, 6. Stock, San Jose, CA 95113Kontaktieren Sie uns unter global.general@jiqizhixin.com