Uczenie maszynowe
Teoria i praktyka
Uczenie maszynowe to metoda analizy danych, która automatyzuje tworzenie modeli analitycznych. Jest to gałąź sztucznej inteligencji (AI) oparta na założeniu, że systemy mogą uczyć się na podstawie danych, identyfikować wzorce i podejmować decyzje przy minimalnej interwencji człowieka.
Ewolucja uczenia maszynowego
Ze względu na rozwój technologii obliczeniowych, dzisiejsze uczenie maszynowe nie przypomina uczenia maszynowego z przeszłości. Narodziło się z rozpoznawania wzorców i teorii, że komputery mogą się uczyć bez programowania do wykonywania określonych zadań; badacze zainteresowani sztuczną inteligencją chcieli sprawdzić, czy komputery mogą uczyć się na podstawie danych. Iteracyjny aspekt uczenia maszynowego jest ważny, gdy modele otrzymują dostęp do nowych danych, mogą niezależnie się dostosowywać. Uczą się na podstawie poprzednich obliczeń, aby podejmować wiarygodne, powtarzalne decyzje i uzyskiwać wyniki. To nauka, która nie jest nowa - ale która nabrała nowego rozpędu.
Wiele algorytmów uczenia maszynowego istnieje już od dłuższego czasu, a zdolność do automatycznego stosowania złożonych obliczeń matematycznych do dużych zbiorów danych - coraz szybciej i szybciej - rozwija się. Oto kilka szeroko nagłośnionych przykładów zastosowań uczenia maszynowego, które mogą być znane:
- Mocno reklamowane, autonomiczne samochody, takie jak Waymo i Tesla? Istota uczenia maszynowego.
- Oferty rekomendacji online, takie jak te od Amazon? Aplikacje uczenia maszynowego w codziennym życiu.
- Wiedza o tym, co klienci mówią o Tobie na platformach mediów społecznościowych? Uczenie maszynowe połączone z tworzeniem reguł językowych.
- Zapobieganie oszustwom i ich wykrywanie? Jedno z bardziej oczywistych i ważnych zastosowań w dzisiejszym świecie.
- GPT Open AI i inne popularne obecnie duże modele językowe (LLM)? Te formy generatywnej sztucznej inteligencji (GenAI ) są zbudowane z modeli uczenia maszynowego.
Uczenie maszynowe i sztuczna inteligencja
Podczas gdy sztuczna inteligencja (AI) to szeroka nauka o naśladowaniu ludzkich umiejętności, uczenie maszynowe to specyficzny podzbiór AI, który uczy maszynę, jak się uczyć. Obejrzyj ten film, aby lepiej zrozumieć związek między sztuczną inteligencją a uczeniem maszynowym. Zobaczysz, jak działają te dwie technologie, z przydatnymi przykładami i kilkoma zabawnymi dodatkami.
Uczenie maszynowe w dzisiejszym świecie
Wykorzystując algorytmy do tworzenia modeli, które odkrywają powiązania, organizacje mogą podejmować lepsze decyzje bez interwencji człowieka. Dowiedz się więcej o technologiach, które zmieniają świat, w którym żyjemy.
Rzeczywiste zastosowania uczenia maszynowego
CNG Holdings wykorzystuje uczenie maszynowe, aby usprawnić wykrywanie oszustw i zapobieganie im, zapewniając jednocześnie płynną obsługę klienta. Koncentrując się na weryfikacji tożsamości od samego początku, przeszli od reaktywnego do proaktywnego zapobiegania nadużyciom. Modele uczenia maszynowego pomagają szybko zweryfikować tożsamość, znacznie zmniejszając liczbę przypadków oszustw i fałszywych alarmów. Dostęp do danych w czasie rzeczywistym pozwala CNG na szybkie dostosowanie strategii podczas prób oszustwa, co prowadzi do obniżenia kosztów i bardziej wydajnych dochodzeń.
Dlaczego uczenie maszynowe jest ważne?
Odradzające się zainteresowanie uczeniem maszynowym wynika z tych samych czynników, które sprawiły, że eksploracja danych i analiza bayesowska stały się bardziej popularne niż kiedykolwiek wcześniej. Rzeczy takie jak rosnąca ilość i różnorodność dostępnych danych, wzrost mocy obliczeniowej, która jest tańsza i bardziej wydajna, tańsze przechowywanie danych.
Wszystko to oznacza, że możliwe jest szybkie i automatyczne tworzenie modeli, które mogą analizować większe, bardziej złożone dane i dostarczać szybsze, dokładniejsze wyniki - nawet na bardzo dużą skalę. Budując precyzyjne modele, organizacja ma większą szansę na zidentyfikowanie zyskownych możliwości - lub uniknięcie nieznanych zagrożeń.
Co jest potrzebne do stworzenia dobrego systemu uczenia maszynowego?
- Umiejętność przygotowania danych.
- Algorytmy - podstawowe i zaawansowane.
- Automatyzacja i procesy iteracyjne.
- Skalowalność.
- Modelowanie zespołowe.
Czy wiesz, że?
- W uczeniu maszynowym cel nazywany jest etykietą.
- W statystyce cel nazywany jest zmienną zależną.
- Zmienna w statystyce nazywana jest cechą w uczeniu maszynowym.
- Transformacja w statystyce nazywana jest tworzeniem cech w uczeniu maszynowym.
Kto go używa?
Większość branż pracujących z dużymi ilościami danych doceniła wartość technologii uczenia maszynowego. Zbierając spostrzeżenia z tych danych - często w czasie rzeczywistym - organizacje są w stanie pracować wydajniej lub zyskać przewagę nad konkurencją.
Usługi finansowe
Banki i inne podmioty z branży finansowej mogą wykorzystywać uczenie maszynowe do poprawy dokładności i wydajności, identyfikowania ważnych informacji w danych, wykrywania nadużyć i zapobiegania im oraz pomocy w przeciwdziałaniu praniu pieniędzy. Eksploracja danych, podzbiór uczenia maszynowego, może identyfikować klientów o profilach wysokiego ryzyka i uwzględniać cyberinwigilację w celu wskazania sygnałów ostrzegawczych oszustwa.
Opieka zdrowotna
Uczenie maszynowe jest coraz częściej wykorzystywane w sektorze ochrony zdrowia, dzięki pojawieniu się urządzeń przenośnych i czujników, które mogą przekazywać dane do oceny stanu zdrowia pacjenta w czasie rzeczywistym. Technologia ta może również pomóc ekspertom medycznym w analizie danych w celu zidentyfikowania trendów lub sygnałów ostrzegawczych, które mogą prowadzić do poprawy diagnostyki i leczenia.
Ubezpieczenia
Uczenie maszynowe rewolucjonizuje branżę ubezpieczeniową, usprawniając ocenę ryzyka, procesy decyzyjne i wykrywanie nadużyć. Pomaga również poprawić jakość obsługi klienta i zwiększyć rentowność. Analizując ogromne ilości danych, algorytmy ML mogą dokładniej oceniać ryzyko, dzięki czemu ubezpieczyciele mogą dostosowywać polisy i ceny do potrzeb klientów.
Nauki przyrodnicze
Uczenie maszynowe oraz inne techniki sztucznej inteligencji i analityki pomagają przyspieszyć badania, poprawić diagnostykę i spersonalizować leczenie w branży farmaceutycznej. Naukowcy mogą na przykład analizować złożone dane biologiczne, identyfikować wzorce i przewidywać wyniki, aby przyspieszyć odkrywanie i opracowywanie leków. W przypadku leczenia, analiza danych pacjenta umożliwia dostosowanie terapii do indywidualnych profili genetycznych i historii zdrowia (w przypadku medycyny spersonalizowanej).
SEKTOR PUBLICZNY
Agencje rządowe odpowiedzialne za bezpieczeństwo publiczne i usługi socjalne wykazują szczególne zapotrzebowanie na uczenie maszynowe, ze względu na ogromne ilości dostępnych danych, które wymagają sprawnej analizy. Na przykład analiza danych z czujników pozwala znaleźć sposoby na zwiększenie wydajności i zaoszczędzenie pieniędzy. Uczenie maszynowe może również pomóc w wykrywaniu nadużyć i minimalizowaniu kradzieży tożsamości.
Handel detaliczny
Strony internetowe, które polecają przedmioty, które mogą Ci się spodobać na podstawie poprzednich zakupów, wykorzystują uczenie maszynowe do analizy historii zakupów. Sprzedawcy detaliczni polegają na uczeniu maszynowym w celu przechwytywania danych, analizowania ich i wykorzystywania do personalizowania doświadczeń zakupowych, wdrażania kampanii marketingowych, optymalizacji cen, planowania towarów i uzyskiwania wglądu w klientów.
Które branże korzystają z tej technologii?
Jak to działa
Aby uzyskać największą wartość z uczenia maszynowego, trzeba wiedzieć, jak połączyć najlepsze algorytmy z odpowiednimi narzędziami i procesami. SAS łączy bogate doświadczenie w dziedzinie statystyki i eksploracji danych z nowymi osiągnięciami architektonicznymi, aby zapewnić jak najszybsze działanie modeli - w dużych środowiskach korporacyjnych lub w środowisku chmury obliczeniowej.
Algorytmy: Graficzne interfejsy użytkownika SAS® pomagają budować modele ML i wdrażać iteracyjny proces uczenia maszynowego. Nie musisz być zaawansowanym statystykiem. Nasz kompleksowy wybór algorytmów uczenia maszynowego jest zawarty w wielu produktach SAS i może pomóc w szybkim uzyskaniu wartości z dużych zbiorów danych - w tym danych z Internetu rzeczy.
Algorytmy uczenia maszynowego SAS obejmują:
- Sieci neuronowe.
- Drzewa decyzyjne.
- Lasy losowe.
- Asocjacje i odkrywanie sekwencji.
Rozwiń listę
- Wzmocnienie gradientu i bagging.
- Obsługa maszyn wektorowych.
- Mapowanie najbliższych sąsiadów.
- Grupowanie K-średnich.
- Samoorganizujące się mapy.
- Lokalne techniki optymalizacji (np. algorytmy genetyczne).
- Maksymalizacja oczekiwań.
- Wielowymiarowe adaptacyjne splajny regresyjne.
- Sieci bayesowskie.
- Estymacja gęstości jądra.
- Analiza składowych głównych.
- Dekompozycja wartości pojedynczej.
- Modele mieszanin Gaussa.
- Sekwencyjne tworzenie reguł pokrycia.
Narzędzia i procesy: Jak już wiemy, nie chodzi tylko o algorytmy. Ostatecznie sekret uzyskania największej wartości z dużych zbiorów danych polega na połączeniu najlepszych algorytmów do danego zadania:
- Kompleksowe zarządzanie danymi i ich jakość.
- GUI do tworzenia modeli i przepływów procesów.
- Interaktywna eksploracja danych i wizualizacja wyników modelu.
- Porównanie różnych modeli uczenia maszynowego w celu szybkiej identyfikacji najlepszego z nich.
- Zautomatyzowana ocena modeli ensemble w celu zidentyfikowania najlepszych wyników.
- Łatwe wdrażanie modeli pozwala szybko uzyskać powtarzalne, wiarygodne wyniki.
- Zintegrowana, kompleksowa platforma do automatyzacji procesu od danych do decyzji.
Rozwiń kompetencje SAS®
Uzyskaj szczegółowe instrukcje i bezpłatny dostęp do oprogramowania SAS, aby rozwinąć swoje umiejętności w zakresie uczenia maszynowego. Kursy obejmują: 14 godzin kursu, 90 dni darmowego dostępu do oprogramowania w chmurze oraz elastyczny format e-learningu, bez konieczności posiadania umiejętności programowania.
Jakie są popularne metody uczenia maszynowego?
Dwie z najczęściej stosowanych metod uczenia maszynowego to uczenie nadzorowane i uczenie bez nadzoru - ale istnieją również inne metody uczenia maszynowego. Oto przegląd najpopularniejszych typów.
Uczenie nadzorowane
Algorytmy uczenia nadzorowanego są trenowane przy użyciu oznaczonych przykładów, takich jak dane wejściowe, w których znane jest pożądane wyjście. Na przykład, urządzenie może mieć punkty danych oznaczone jako "F" (nieudane) lub "R" (działa). Algorytm uczący się otrzymuje zestaw danych wejściowych wraz z odpowiadającymi im prawidłowymi danymi wyjściowymi, a algorytm uczy się, porównując swoje rzeczywiste dane wyjściowe z prawidłowymi danymi wyjściowymi w celu znalezienia błędów. Następnie odpowiednio modyfikuje model. Dzięki metodom takim jak klasyfikacja, regresja, przewidywanie i wzmacnianie gradientowe, uczenie nadzorowane wykorzystuje wzorce do przewidywania wartości etykiety na dodatkowych nieoznakowanych danych. Uczenie nadzorowane jest powszechnie stosowane w aplikacjach, w których dane historyczne przewidują prawdopodobne przyszłe zdarzenia. Na przykład może przewidzieć, kiedy transakcje kartą kredytową mogą być nieuczciwe lub który klient ubezpieczeniowy prawdopodobnie złoży roszczenie.
Uczenie bez nadzoru
Uczenie nienadzorowane jest wykorzystywane w odniesieniu do danych, które nie mają historycznych etykiet. System nie podaje "prawidłowej odpowiedzi." Algorytm musi dowiedzieć się, co jest wyświetlane. Celem jest zbadanie danych i znalezienie w nich struktury. Uczenie bez nadzoru działa dobrze na danych transakcyjnych. Może na przykład identyfikować segmenty klientów o podobnych cechach, którzy mogą być następnie traktowani podobnie w kampaniach marketingowych. Może też znaleźć główne atrybuty, które oddzielają segmenty klientów od siebie. Popularne techniki obejmują samoorganizujące się mapy, mapowanie najbliższych sąsiadów, grupowanie k-średnich i dekompozycję wartości pojedynczej. Algorytmy te są również wykorzystywane do segmentacji tematów tekstowych, rekomendowania elementów i identyfikowania wartości odstających.
Uczenie pół-nadzorowane
Uczenie pół-nadzorowane jest wykorzystywane do tych samych zastosowań, co uczenie nadzorowane. Wykorzystuje on jednak zarówno oznaczone, jak i nieoznaczone dane do szkolenia - zazwyczaj niewielką ilość oznaczonych danych z dużą ilością nieoznaczonych danych (ponieważ nieoznaczone dane są tańsze i ich pozyskanie wymaga mniej wysiłku). Ten rodzaj uczenia się może być wykorzystywany z metodami takimi jak klasyfikacja, regresja i przewidywanie. Uczenie pół-nadzorowane jest przydatne, gdy koszt związany z etykietowaniem jest zbyt wysoki, aby umożliwić w pełni etykietowany proces uczenia. Wczesne przykłady obejmują identyfikację twarzy osoby na kamerze internetowej.
Uczenie ze wzmocnieniem
Uczenie ze wzmocnieniem jest często wykorzystywane w robotyce, grach i nawigacji. Jest on również używany w połączeniu z technikami generatywnej sztucznej inteligencji, takimi jak duże modele językowe. Dzięki uczeniu ze wzmocnieniem algorytm odkrywa metodą prób i błędów, które działania przynoszą największe korzyści. Ten rodzaj uczenia się ma trzy podstawowe elementy: agenta (uczącego się lub podejmującego decyzje), środowisko (wszystko, z czym agent wchodzi w interakcję) i działania (to, co agent może zrobić). Celem jest, aby agent wybrał działania, które maksymalizują oczekiwaną nagrodę w danym czasie. Agent osiągnie cel znacznie szybciej, stosując dobrą politykę. Celem uczenia ze wzmocnieniem jest więc nauczenie się najlepszej polityki.
Zarządzanie danymi wymaga AI i uczenia maszynowego, a co równie ważne, AI/ML potrzebuje zarządzania danymi. Obecnie oba te elementy są ze sobą powiązane, a droga do udanej sztucznej inteligencji jest nierozerwalnie związana z nowoczesnymi praktykami zarządzania danymi. Dan Soceanu Senior Product Manager for AI and Data Management, SAS
Jakie są różnice między eksploracją danych, uczeniem maszynowym i uczeniem głębokim?
Chociaż wszystkie te metody mają ten sam cel - wyodrębnienie spostrzeżeń, wzorców i relacji, które można wykorzystać do podejmowania decyzji - mają różne podejścia i możliwości.