Auf der AWS re:Invent 2021 – einer von Amazon Web Services veranstalteten Lernkonferenz für die globale Cloud-Computing-Community – haben wir viele spannende neue Funktionen, Services und Webanwendungen kennengelernt. Im Bereich der Datenanalyse liegt der Schwerpunkt auf serverlosem Computing, Datensicherheit, Archivierung und der Verbesserung der Benutzerfreundlichkeit. Lassen Sie uns diese neuen Angebote kurz besprechen und erläutern, inwiefern sie für AWS-Kunden hilfreich sein können.
Die neue Version bietet die nötige Flexibilität, um Big-Data-Anwendungen ohne den Erwerb von Clustern auszuführen. Sie stellt automatisch die Rechenleistung und den Arbeitsspeicher bereit, die die Anwendungen benötigen, und skaliert sie, sodass Sie nur für die Ressourcen bezahlen, die Sie auch verwenden.
Bei vorinitialisierten Workern werden Jobs beim Anwendungsstart sofort ausgeführt. Zu den Vorteilen gehören:
Amazon Redshift Serverless räumt einen Nachteil der Vergangenheit aus: Bisher war ein Redshift-Cluster erforderlich, um die leistungsstarke Abfrage-Engine von Redshift zu verwenden. AWS hat Redshift Serverless eingeführt, um leistungsstarke Analysen durchzuführen.
Es hilft bei der Verwaltung variabler Workloads mit unvorhersehbaren Spitzen, bei denen es schwierig sein kann, die Kapazität in einem Cluster kontinuierlich zu verwalten.
Zu den Vorteilen gehören:
Der webbasierte Abfrageeditor funktioniert ohne Konfiguration eines SQL-Clients.
Es ist jetzt möglich, den Apache-Kafka-Cluster auszuführen, ohne seine Kapazität zu verwalten und zu skalieren. Dies unterstützt native AWS-Integrationen, die unter anderem private Konnektivität mit AWS PrivateLink, sicheren Clientzugriff mit IAM und die Kontrolle der Schema-Entwicklung mit AWS Glue bieten. Zu den Vorteilen gehören:
Governed Tables ist eine neue Art von S3-Tabelle, die ACID-Transaktionen unterstützt, mehreren Benutzern das gleichzeitige Einfügen und Löschen von Daten ermöglicht und sicherstellt, dass die Daten konsistent und aktuell sind. Es beinhaltet eine automatische Verdichtung zur Speicheroptimierung.
Eine Sicherheitsfunktion auf Zeilen-/Zellenebene bietet Benutzern eine fein abgestufte Zugriffskontrolle auf die Daten, die in einem Data Lake gespeichert sind. Es unterstützt sowohl geregelte als auch traditionelle S3-Tabellen.
Reduzieren Sie die Speicherkosten um 60 %, indem Sie Daten, auf die Sie selten zugreifen, in die neue Tabellenklasse DynamoDB Standard-Infrequent-Access von Amazon verschieben. Zu den Vorteilen gehören:
Es kann zeitaufwändig sein, einen geeigneten Drittanbieter-Datensatz zu finden, die Daten zu lizenzieren und zu laden. Mit AWS Data Exchange for APIs können Sie die Datensätze im AWS Marketplace einfach abonnieren. Nachdem Sie ein Datenprodukt abonniert haben, laden Sie Daten direkt in Amazon S3 oder Redshift. Anschließend können Sie diese mit den AWS-Analyse- und ML-Services analysieren.
Zu den Vorteilen gehören:
Unternehmen verlassen sich stark auf kritische Anwendungsfälle wie Betrugserkennung, Verringerung der Kundenabwanderung und Bestandsoptimierung, um bessere Entscheidungen zu treffen. Sie warten jedoch darauf, dass Entwickler oder andere Experten solche Modelle für sie bauen. Mit SageMaker Canvas kann jeder Ingenieur oder Business-Analyst den Drag-and-Drop-Editor verwenden, um genaue ML-Vorhersagen zu generieren – auch ohne ML-Erfahrung.
Zu den Vorteilen gehören:
Zu den Vorteilen gehören:
SageMaker Serverless Inference von Amazon ermöglicht die Bereitstellung von ML-Modellen, ohne die zugrunde liegende Infrastruktur zu konfigurieren oder zu verwalten. Wenn Sie die serverlose Option auswählen, stellt SageMaker basierend auf dem Volumen der Inferenzanfragen automatisch Rechenkapazität bereit, übernimmt die Skalierung und deaktiviert sie. Zu den Vorteilen gehören:
Mit SageMaker Studio Lab hat Amazon einen kostenlosen, konfigurationsfreien Dienst für das Training auf CPUs oder GPUs mit 15 GB persistentem Speicher entwickelt. Basierend auf der Open-Source-Web-App Jupyter Lab, können Mitarbeiter mit maschinellem Lernen testen und experimentieren, indem sie die meisten Open-Source-Frameworks nutzen.
Serverless Computing ermöglicht Kosteneinsparungen und bietet den zusätzlichen Vorteil, dass keine Ressourcen verwaltet oder überwacht werden müssen. Die Lösungen lassen sich somit leichter anwenden: Kunden müssen sich bei einer serverlosen Umgebung vor der Testphase nicht allzu viele Gedanken über die Konfiguration machen. Zudem hat AWS seinen ML-Angeboten mehrere Point-and-Click-Funktionen hinzugefügt, die es Benutzern ermöglichen, ML-Lösungen ohne Programmierkenntnisse oder vorherige Erfahrung zu entwickeln. Insgesamt hat AWS mehrere Dienste und serverlose Anwendungen vereinfacht. Kunden müssen sich somit keine Gedanken über Kosteneinsparungspläne und können unvorhersehbare Arbeitslasten nahtlos bewältigen.