T-Systems-Claim-Logo
Suchen
Rote abstrakte Linien auf schwarzem Hintergrund

AWS re:Invent 2021: Neue Angebote zur Datenanalyse

Zusammenfassung der spannenden neuen Angebote zur Datenanalyse von AWS, die auf der re:Invent 2021 angekündigt wurden

20. Dezember 2021Parvez Ahmad

Highlights AWS re:Invent – serverloses Computing

Auf der AWS re:Invent  2021 – einer von Amazon Web Services veranstalteten Lernkonferenz für die globale Cloud-Computing-Community – haben wir viele spannende neue Funktionen, Services und Webanwendungen kennengelernt. Im Bereich der Datenanalyse liegt der Schwerpunkt auf serverlosem Computing, Datensicherheit, Archivierung und der Verbesserung der Benutzerfreundlichkeit. Lassen Sie uns diese neuen Angebote kurz besprechen und erläutern, inwiefern sie für AWS-Kunden hilfreich sein können.

Neue Version von Amazon EMR Serverless

Frau in einem Büro mit Blick auf ein Tablet

Die neue Version bietet die nötige Flexibilität, um Big-Data-Anwendungen ohne den Erwerb von Clustern auszuführen. Sie stellt automatisch die Rechenleistung und den Arbeitsspeicher bereit, die die Anwendungen benötigen, und skaliert sie, sodass Sie nur für die Ressourcen bezahlen, die Sie auch verwenden.

Bei vorinitialisierten Workern werden Jobs beim Anwendungsstart sofort ausgeführt. Zu den Vorteilen gehören:

  • Cluster müssen nicht konfiguriert, optimiert, betrieben, skaliert oder gesichert werden.
  • Ein Job wird in einer einzelnen AZ ausgeführt. Auf diese Weise werden Leistungseinbußen durch den Netzwerkverkehr über AZs hinweg vermieden.
  • Kein Neuschreiben erforderlich, vorhandene Anwendungen sollten auf EMR Serverless funktionieren.

Einführung von Amazon Redshift Serverless

Cloud Netzwerk Lösung digitaler Hintergrund

Amazon Redshift Serverless räumt einen Nachteil der Vergangenheit aus: Bisher war ein Redshift-Cluster erforderlich, um die leistungsstarke Abfrage-Engine von Redshift zu verwenden. AWS hat Redshift Serverless eingeführt, um leistungsstarke Analysen durchzuführen.
Es hilft bei der Verwaltung variabler Workloads mit unvorhersehbaren Spitzen, bei denen es schwierig sein kann, die Kapazität in einem Cluster kontinuierlich zu verwalten.
Zu den Vorteilen gehören:

  • Es stellt die richtige Rechenleistung bereit und lässt sich nahtlos an den Bedarf anpassen.
  • Sie zahlen nur für das Abfragen und Laden von Daten. Keine Kosten bei Lagerstillstand.
  • Sie können Datenspeicher wie S3, Aurora und RDS abfragen.

Der webbasierte Abfrageeditor funktioniert ohne Konfiguration eines SQL-Clients.

Neuer Clustertyp: Amazon MSK Serverless

Es ist jetzt möglich, den Apache-Kafka-Cluster auszuführen, ohne seine Kapazität zu verwalten und zu skalieren. Dies unterstützt native AWS-Integrationen, die unter anderem private Konnektivität mit AWS PrivateLink, sicheren Clientzugriff mit IAM und die Kontrolle der Schema-Entwicklung mit AWS Glue bieten. Zu den Vorteilen gehören:

  • Weniger Konfigurationen erleichtern das Starten des Kafka-Clusters.
  • Clusterkapazität und Partitionen werden automatisch verwaltet.
  • Pay-as-you-go-Preise, keine Vorabgebühren. Stundensatz pro Cluster, pro Partition.

AWS Lake Formation; neue Tabelle & Sicherheit

Governed Tables ist eine neue Art von S3-Tabelle, die ACID-Transaktionen unterstützt, mehreren Benutzern das gleichzeitige Einfügen und Löschen von Daten ermöglicht und sicherstellt, dass die Daten konsistent und aktuell sind. Es beinhaltet eine automatische Verdichtung zur Speicheroptimierung.

Eine Sicherheitsfunktion auf Zeilen-/Zellenebene bietet Benutzern eine fein abgestufte Zugriffskontrolle auf die Daten, die in einem Data Lake gespeichert sind. Es unterstützt sowohl geregelte als auch traditionelle S3-Tabellen.

Neue Standard-Tabelle für Infrequent Access

Reduzieren Sie die Speicherkosten um 60 %, indem Sie Daten, auf die Sie selten zugreifen, in die neue Tabellenklasse DynamoDB Standard-Infrequent-Access von Amazon verschieben. Zu den Vorteilen gehören:

  • Es ist kein Archivierungsprozess in S3 erforderlich.
  • Die Leistung entspricht der Standard-Tabellenklasse.
  • Lese- und Schreibleistung liegen im einstelligen Millisekundenbereich.

Neu: AWS Data Exchange for APIs

Es kann zeitaufwändig sein, einen geeigneten Drittanbieter-Datensatz zu finden, die Daten zu lizenzieren und zu laden. Mit AWS Data Exchange for APIs können Sie die Datensätze im AWS Marketplace einfach abonnieren. Nachdem Sie ein Datenprodukt abonniert haben, laden Sie Daten direkt in Amazon S3 oder Redshift. Anschließend können Sie diese mit den AWS-Analyse- und ML-Services analysieren.

Zu den Vorteilen gehören:

  • Schnelle Auswahl aus diversen Datensätzen wie Klima, Gesundheitswesen, Medien etc.
  • Keine Notwendigkeit, physische Medien anzufordern, FTP zu verwalten oder APIs von mehreren Anbietern zu integrieren

Einführung in Amazon SageMaker Canvas

Unternehmen verlassen sich stark auf kritische Anwendungsfälle wie Betrugserkennung, Verringerung der Kundenabwanderung und Bestandsoptimierung, um bessere Entscheidungen zu treffen. Sie warten jedoch darauf, dass Entwickler oder andere Experten solche Modelle für sie bauen. Mit SageMaker Canvas kann jeder Ingenieur oder Business-Analyst den Drag-and-Drop-Editor verwenden, um genaue ML-Vorhersagen zu generieren – auch ohne ML-Erfahrung.

Zu den Vorteilen gehören:

  • Schneller Zugriff auf Cloud- oder lokale Daten
  • Kombination von Datensätzen, um einen einheitlichen Datensatz für das Training zu erstellen
  • Automatische Erkennung von Datenfehlern
  • Automatisches Erstellen und Trainieren von Modellen via AutoML-Technologie von SageMaker

Nachfolger von SageMaker Ground Truth

Zu den Vorteilen gehören:

  • Kostenreduzierung um 40 %
  • Keine tiefgreifende ML-Erfahrung erforderlich
  • Bedient eine Vielzahl von Anwendungsfällen wie Computer Vision, NLP und Spracherkennung

Neu: SageMaker Serverless Inference

SageMaker Serverless Inference von Amazon ermöglicht die Bereitstellung von ML-Modellen, ohne die zugrunde liegende Infrastruktur zu konfigurieren oder zu verwalten. Wenn Sie die serverlose Option auswählen, stellt SageMaker basierend auf dem Volumen der Inferenzanfragen automatisch Rechenkapazität bereit, übernimmt die Skalierung und deaktiviert sie. Zu den Vorteilen gehören:

  • Sie zahlen nur für die Dauer der Ausführung des Codes und der verarbeiteten Daten, nicht für Leerlaufzeiten.
  • Sie können zeitweiligen oder unvorhersehbaren Datenverkehr effizient bewältigen.

Kostenloses Amazon SageMaker Studio Lab

Mit SageMaker Studio Lab hat Amazon einen kostenlosen, konfigurationsfreien Dienst für das Training auf CPUs oder GPUs mit 15 GB persistentem Speicher entwickelt. Basierend auf der Open-Source-Web-App Jupyter Lab, können Mitarbeiter mit maschinellem Lernen testen und experimentieren, indem sie die meisten Open-Source-Frameworks nutzen.

Zusammenfassung

Serverless Computing ermöglicht Kosteneinsparungen und bietet den zusätzlichen Vorteil, dass keine Ressourcen verwaltet oder überwacht werden müssen. Die Lösungen lassen sich somit leichter anwenden: Kunden müssen sich bei einer serverlosen Umgebung vor der Testphase nicht allzu viele Gedanken über die Konfiguration machen. Zudem hat AWS seinen ML-Angeboten mehrere Point-and-Click-Funktionen hinzugefügt, die es Benutzern ermöglichen, ML-Lösungen ohne Programmierkenntnisse oder vorherige Erfahrung zu entwickeln. Insgesamt hat AWS mehrere Dienste und serverlose Anwendungen vereinfacht. Kunden müssen sich somit keine Gedanken über Kosteneinsparungspläne und können unvorhersehbare Arbeitslasten nahtlos bewältigen.

Zum Autor
Bild von Ahmad Parvez

Parvez Ahmad

Datenanalyst, T-Systems International GmbH

Profil und alle Artikel ansehen

Wir liefern Ihnen unsere Insights direkt in Ihre Mailbox

Erhalten Sie die besten Expertentipps rund um Events, Best Practices, Whitepaper und mehr. Individuell für Ihre Branche!

Das könnte Sie auch interessieren:

Besuchen Sie t-systems.com außerhalb von Germany? Besuchen Sie die lokale Website für weiterführende Informationen und Angebote für Ihr Land.