Wie Amazon die Lücke in der Datenwissenschaft schließen möchte, indem maschinelles Lernen in die Cloud gebracht wird

Unternehmen suchen zunehmend nach Möglichkeiten, ihren Gewinn zu steigern, indem sie die von ihnen gesammelten Daten abbauen.

Für Unternehmen ist es jedoch schwierig, aussagekräftige Informationen zu extrahieren, wenn Datenwissenschaftler Mangelware sind.

Als Reaktion auf diesen Fachkräftemangel haben große Cloud-Anbieter On-Demand-Dienste eingerichtet, um Unternehmen die Möglichkeit zu geben, mit maschinellem Lernen zu beginnen.

Maschinelles Lernen ist eine Technik, mit der Computer nach Mustern in Daten suchen können und die die Online-Empfehlungs-Engines unterstützt, die Bücher oder Filme vorschlagen, die Ihnen gefallen könnten. Unternehmen können Modelle für maschinelles Lernen verwenden, um nützliche Vorhersagen zu treffen: z. B. "Ist dies E-Mail-Spam?" oder 'Wie viele Artikel werden voraussichtlich in dieser Region verkauft?'

AWS General Manager für Datenwissenschaft Matt Wood Bild: Amazon

Amazon, Microsoft und Google bieten On-Demand-Dienste für maschinelles Lernen über ihre jeweiligen Cloud-Plattformen mit jeweils unterschiedlichem Zugriff für Entwickler ohne statistischen Hintergrund.

Amazon nutzt maschinelles Lernen seit seinen Anfängen als Online-Buchhändler, als es eine Möglichkeit brauchte, seinen menschlichen Redakteuren bei der Auswahl von Empfehlungen aus seiner eine Million starken Bibliothek zu helfen.

"Wir haben als Unternehmen sehr früh entschieden, dass maschinelles Lernen wichtig sein wird, wenn unser Geschäft wächst", sagte Matt Wood, General Manager für Data Science bei Amazon Web Services (AWS).

"Wir hatten eine Entscheidung zu treffen. Wollen wir eine ganze Menge Experten und Spezialisten für maschinelles Lernen einstellen, wenn diese Jungs und Mädchen sehr selten sind? Das ist eine sehr seltene Mischung aus Fähigkeiten der Statistik, der Kreuzvalidierung, von Algorithmus-Design. "

Stattdessen entschied sich Amazon, eine relativ kleine Gruppe von Experten für maschinelles Lernen einzustellen, um einen internen Service aufzubauen, den alle Entwickler nutzen konnten.

"Wir haben dieses Flair der Innovation gesehen, weil Entwickler nicht viel Zeit damit verbringen mussten, sich mit maschinellem Lernen zu beschäftigen, um seine Vorteile nutzen zu können", sagte er und verwies auf die Rolle des Dienstes in Bereichen wie Erfüllung und Kapazität Planung, Lieferkettenmanagement und Identifizierung gefälschter Waren.

Der heute von AWS angebotene öffentliche Service für maschinelles Lernen basiert auf denselben Algorithmen, die das Unternehmen seinen Mitarbeitern intern zur Verfügung stellt. Kunden können Modelle für maschinelles Lernen mithilfe von Daten erstellen, die im relationalen Datendienst von Amazon mit einem MySQL-Backend, dem S3-Objektspeicher oder dem Redshift-Data-Warehousing-Dienst gespeichert sind, um sie zu trainieren.

Diese Modelle können verwendet werden, um verschiedene Arten von Vorhersagen zu treffen. Die binäre Klassifizierung wird verwendet, um eines von zwei möglichen Ergebnissen vorherzusagen: "Ist dies E-Mail-Spam oder nicht?". Klassifizierung in mehreren Klassen zur Vorhersage eines von drei oder mehr möglichen Ergebnissen und der Wahrscheinlichkeit jedes einzelnen - "Ist dieses Produkt ein Buch, ein Film oder ein Kleidungsstück?". Die Regression wird verwendet, um eine Zahl vorherzusagen - "Wie hoch ist die voraussichtliche Temperatur morgen?".

Der Dienst wird auch versuchen, die Daten automatisch zu validieren und wenn möglich in eine nützlichere Form umzuwandeln, z. B. die Postleitzahl oder Postleitzahl aus einer Adresse zu extrahieren.

Sobald das Modell erstellt ist, können Entwickler über die AWS-Konsole oder API-Aufrufe darauf zugreifen, sodass die Vorhersagen einer App oder einem Onlinedienst zugeführt werden können. Modelle können mithilfe von Schiebereglern in der Konsole feinabgestimmt werden.

"Der Entwickler muss sehr, sehr wenig über maschinelles Lernen wissen. Die maschinellen Lernschritte werden vom Dienst verwaltet", sagte Wood.

Cloud-basierte Dienste wie diese verringern die Schwierigkeit, mit maschinellem Lernen zu experimentieren, und reduzieren die Zeit und das Geld, die erforderlich sind, um die Fähigkeiten zu erlernen, um loszulegen, sagte er.

Amazon testete, wie viel einfacher der Service es Entwicklern machte, mit maschinellem Lernen zu beginnen, und beauftragte zwei Entwickler ohne maschinellen Lernhintergrund, ein Modell für die Vorhersage des Geschlechts einer Person anhand ihres Vornamens zu erstellen.

Die Entwickler brauchten einen Monat, um ihr Modell zu erstellen, das anhand von Volkszählungsdaten und vorhergesagtem Geschlecht mit einer Genauigkeit von 92 Prozent trainiert wurde. Im Gegensatz dazu benötigte ein Entwickler ohne Kenntnisse des maschinellen Lernens 20 Minuten, um dasselbe Modell mit derselben Vorhersagegenauigkeit mithilfe des Amazon-Dienstes zu erstellen.

Das heißt nicht, dass diese Cloud-Dienste für alle Anforderungen des maschinellen Lernens geeignet sind.

Zum einen können sie zwar die Kosten für den Einstieg senken, ihre Verwendung kann jedoch langfristig teuer sein. Der Service von Amazon kann etwa 100 US-Dollar pro eine Million Vorhersagen kosten.

Wie ein Unternehmer sagte: "Das wäre bei meinem Startup sehr schön, aber es ist selbst bei einem sehr großen Budget unerschwinglich."

Der Dienst hat auch Kritik für das Sperren von Benutzern hervorgerufen, da der Dienst Benutzern nicht erlaubt, Modelle zu exportieren und zu importieren.

"Ich sehe nicht ein, wie ein Unternehmen mit einem gewissen Sinn sein Vorhersagemodell in AWS sperren würde", sagte ein Benutzer im Entwicklerforum Hacker News.

Trotz dieser Kritik an dem noch jungen Dienst glaubt Wood, dass dies zu mehr Experimenten mit maschinellem Lernen in Unternehmen führen wird, die zuvor nicht gewusst hätten, wo sie anfangen sollen.

"Der Schlüssel für mich ist die Produktivität und die Sicherstellung, dass Entwickler Zugriff auf dieses Material haben."

© Copyright 2020 | mobilegn.com