Implementowanie usługi Azure Purview
Microsoft Purview to ujednolicona usługa zapewniania ładu danych, która ułatwia zarządzanie danymi lokalnymi, wielochmurowymi i oprogramowaniem jako usługą (SaaS) oraz zarządzanie nimi. Utwórz całościową, aktualną mapę krajobrazu danych z automatycznym odnajdywaniem danych, klasyfikacją poufnych danych i kompleksowym pochodzeniem danych. Włącz kuratorom danych zarządzanie zasobami danych i zabezpieczanie ich. Umożliwienie konsumentom danych znalezienia cennych, godnych zaufania danych.
Jak to działa
Usługa Microsoft Purview automatyzuje odnajdywanie danych, zapewniając skanowanie i klasyfikację danych jako usługę dla zasobów w obrębie infrastruktury danych. Metadane i opisy odnalezionych zasobów danych są zintegrowane z całościową mapą majątku danych. Na szczycie tej mapy istnieją specjalnie utworzone aplikacje, które tworzą środowiska do odnajdywania danych, zarządzania dostępem i szczegółowych informacji o krajobrazie danych.
Obsługiwane funkcje
Zrozumienie lokalizacji i przenoszenia poufnych danych w całej domenie danych jest jedną z głównych funkcji usługi Azure Purview dla usługi Azure SQL Database.
Tworzenie ujednoliconej mapy danych w całej domenie danych
Usługa Azure Purview ułatwia tworzenie podstaw efektywnego zarządzania danymi, w tym następujące możliwości:
- Automatyzowanie metadanych zasobów hybrydowych i zarządzanie nimi.
- Klasyfikowanie danych przy użyciu zintegrowanych i niestandardowych klasyfikacji oraz etykiet poufności ochrony informacji.
- Upewnij się, że spójne etykietowanie poufnych danych w usługach SQL Server, Azure, Microsoft 365 i Power BI.
- Łatwe integrowanie wszystkich systemów danych przy użyciu interfejsów API usługi Apache Atlas.
Ułatwianie znajdowania danych
Ułatwiaj znajdowanie danych przy użyciu znanych terminów wyszukiwania biznesowego i technicznego, w tym następujących możliwości:
- Zapewnij optymalną wartość biznesową dla danych użytkowników przy użyciu Wykaz danych w Microsoft Purview.
- Eliminuje potrzebę słowników danych w programie Excel przy użyciu słownika biznesowego na poziomie biznesowym.
- Uzyskaj wgląd w pochodzenie danych za pomocą interaktywnej wizualizacji źródła danych.
- Udostępniaj analitykom danych, inżynierom i analitykom dane potrzebne do analizy biznesowej, analizy, sztucznej inteligencji i uczenia maszynowego.
Zapoznaj się z omówieniem poufnych danych
Usługa Microsoft Purview zapewnia kompleksowy widok operacji zarządzania danymi za pomocą usługi Data Insights (w wersji zapoznawczej), w tym następujących możliwości:
- Wyświetl całą domenę danych i jej dystrybucję według wymiaru zasobu, na przykład typ źródła, klasyfikację i rozmiar pliku.
- Odbierz aktualizacje stanu dotyczące liczby skanowań, które przeszły, nie powiodły się lub anulowały.
- Uzyskiwanie kluczowych szczegółowych informacji w celu dodawania lub redystrybucji terminów słownika w celu uzyskania lepszych wyników wyszukiwania.
Wymagania
Przed rozpoczęciem pracy z usługą Microsoft Purview upewnij się, że spełnione są następujące wymagania:
- Dostęp do platformy Microsoft Azure przy użyciu subskrypcji programistycznej lub produkcyjnej.
- Możliwość tworzenia zasobów platformy Azure, w tym usługi Microsoft Purview.
- Dostęp do źródeł danych, takich jak Azure Data Lake Storage lub Azure SQL w środowiskach testowych, programistycznych lub produkcyjnych.
- W przypadku Data Lake Storage wymaganą rolą do skanowania jest Czytelnik.
- W przypadku Azure SQL tożsamość musi mieć możliwość wykonywania zapytań względem tabel w celu próbkowania klasyfikacji.
- Dostęp do Microsoft Defender dla chmury lub możliwość współpracy z usługą Defender for Cloud Administracja na potrzeby etykietowania danych.
- Aktywne konto usługi Microsoft Purview.
- Musisz być administratorem źródła danych i czytelnikiem danych , aby zarejestrować źródło i zarządzać nim w portalu ładu usługi Microsoft Purview.
Zagadnienia dotyczące bezpieczeństwa
Zapoznajmy się z ważnymi funkcjami zabezpieczeń podczas skanowania SQL Database przy użyciu usługi Microsoft Purview.
Ustawienia zapory
Jeśli serwer bazy danych ma włączoną zaporę, należy zaktualizować zaporę, aby zezwolić na dostęp na jeden z dwóch sposobów:
Zezwalaj na połączenia platformy Azure za pośrednictwem zapory — Prosta opcja kierowania ruchu przez sieć platformy Azure bez konieczności zarządzania maszynami wirtualnymi.
Instalowanie własnego środowiska Integration Runtime — Zainstaluj własne środowisko Integration Runtime na maszynie w sieci i przyznaj mu dostęp za pośrednictwem zapory. Jeśli masz prywatną sieć wirtualną skonfigurowaną na platformie Azure lub masz skonfigurowaną inną zamkniętą sieć, korzystając z własnego środowiska Integration Runtime na maszynie w tej sieci, możesz w pełni zarządzać przepływem ruchu i korzystać z istniejącej sieci.
Korzystanie z zarządzanej sieci wirtualnej — Środowisko Azure Integration Runtime w zamkniętej sieci można użyć, konfigurując zarządzaną sieć wirtualną przy użyciu konta usługi Microsoft Purview, aby nawiązać połączenie z Azure SQL.
Authentication
Aby przeskanować źródło danych, należy skonfigurować metodę uwierzytelniania w bazie danych Azure SQL. Następujące opcje uwierzytelniania są obsługiwane podczas przygotowywania do skanowania:
Tożsamość zarządzana przypisana przez system (zalecana) — Jest to tożsamość skojarzona bezpośrednio z kontem usługi Microsoft Purview, która umożliwia uwierzytelnianie bezpośrednio z innymi zasobami platformy Azure bez konieczności zarządzania zestawem poświadczeń lub użytkownika. Tożsamość zarządzana przypisana przez system jest tworzona podczas tworzenia zasobu usługi Microsoft Purview, jest zarządzana przez platformę Azure i używa nazwy konta Microsoft Purview. Tożsamość zarządzana przypisana przez system nie może być obecnie używana z własnym środowiskiem Integration Runtime dla Azure SQL.
Tożsamość zarządzana przypisana przez użytkownika (wersja zapoznawcza) — Podobnie jak tożsamość zarządzana przypisana przez system, tożsamość zarządzana przypisana przez użytkownika jest zasobem poświadczeń, który umożliwia usłudze Microsoft Purview uwierzytelnianie w usłudze Azure Active Directory. Przypisany przez użytkownika użytkownik zarządzany przez użytkowników na platformie Azure, a nie przez samą platformę Azure, co zapewnia większą kontrolę nad zabezpieczeniami. Tożsamość zarządzana przypisana przez użytkownika nie może być obecnie używana z własnym środowiskiem Integration Runtime dla Azure SQL. Aby uzyskać więcej informacji, zobacz nasz przewodnik dotyczący tożsamości zarządzanych przypisanych przez użytkownika.
Jednostka usługi — Jednostka usługi to aplikacja, która może mieć przypisane uprawnienia, takie jak dowolna inna grupa lub użytkownik, bez bezpośredniego skojarzenia z osobą. Uwierzytelnianie ma datę wygaśnięcia i może być przydatne w przypadku projektów tymczasowych.
Uwierzytelnianie SQL — Połącz się z bazą danych SQL za pomocą nazwy użytkownika i hasła.
Uwaga
Jeśli używasz własnego środowiska Integration Runtime do łączenia się z zasobem, tożsamości zarządzane przypisane przez system i przypisane przez użytkownika nie będą działać. Należy użyć uwierzytelniania jednostki usługi lub uwierzytelniania SQL.
Rejestrowanie i skanowanie SQL Database przy użyciu usługi Azure Purview
Ta sekcja umożliwia zarejestrowanie źródła danych usługi Azure SQL Database i skonfigurowanie skanowania.
Rejestrowanie źródła danych
Przed skonfigurowaniem skanowania wymagane jest zarejestrowanie źródła danych w usłudze Microsoft Purview.
Otwórz konto usługi Microsoft Purview i wybierz pozycję Otwórz portal ładu usługi Microsoft Purview.
Wybierz pozycjęKolekcjemap> danych w okienku po lewej stronie, aby otworzyć stronę zarządzania kolekcjami. Utwórz hierarchię kolekcji przy użyciu menu Kolekcje i przypisz uprawnienia do poszczególnych kolekcji podrzędnych zgodnie z wymaganiami.
Przejdź do odpowiedniej kolekcji w menu Źródła, a następnie wybierz pozycję Zarejestruj, aby zarejestrować nową SQL Database.
Wybierz źródło danych bazy danych Azure SQL, a następnie wybierz pozycję Kontynuuj.
Podaj nazwę źródła danych, wybierz subskrypcję platformy Azure, wybierz nazwę serwera SQL Database, a następnie wybierz pozycję Zastosuj.
Baza danych Azure SQL zostanie wyświetlona w wybranej kolekcji.
Tworzenie skanowania
Aby utworzyć i skonfigurować skanowanie, wykonaj następujące kroki:
Otwórz konto usługi Microsoft Purview i wybierz portal ładu Otwórz usługę Microsoft Purview .
Wybierz ikonę Mapa danych , a następnie pozycję Źródła , aby wyświetlić hierarchię kolekcji.
Wybierz ikonę Nowe skanowanie w obszarze Azure SQL Baza danych zarejestrowana wcześniej.
Podaj nazwę skanowania, wybierz pozycję Wprowadź ręcznie dla właściwości Metoda wyboru bazy danych , wprowadź nazwę bazy danych i wybierz pozycję Poświadczenia. Wybierz odpowiednią kolekcję do skanowania, a następnie wybierz pozycję Testuj połączenie , aby zweryfikować połączenie. Jeśli połączenie zakończy się pomyślnie, wybierz pozycję Kontynuuj.
Określanie zakresu i uruchamianie skanowania
Aby ograniczyć zakres i uruchomić skanowanie, wykonaj następujące kroki:
Możesz ograniczyć zakres skanowania do określonych obiektów bazy danych, wybierając odpowiednie elementy na liście.
Wybierz zestaw reguł skanowania. Możesz wybrać między domyślnymi systemami, istniejącymi niestandardowymi zestawami reguł lub utworzyć nowy wbudowany zestaw reguł.
Wybierz pozycję Nowy zestaw reguł skanowania i podaj nową nazwę zestawu reguł skanowania.
Następnie możesz wybrać reguły klasyfikacji, które mają zostać uwzględnione w regule skanowania, a następnie wybrać pozycję Utwórz.
Na stronie Wybierz zestaw reguł skanowania zostanie utworzony zestaw reguł skanowania.
Na stronie Ustawianie wyzwalacza skanowania skonfiguruj wyzwalacz skanowania. Wybierz opcję Kontynuuj.
Przejrzyj skanowanie, a następnie wybierz pozycję Zapisz i uruchom.
Wyświetlanie skanowania
Aby wyświetlić skanowanie, wykonaj następujące kroki:
Przejdź do źródła danych w kolekcji, a następnie wybierz pozycję Wyświetl szczegóły , aby sprawdzić stan skanowania.
Szczegóły skanowania wskazują postęp skanowania w stanie Ostatnie uruchomienie oraz liczbę zasobów zeskanowanych i sklasyfikowanych. Stan Ostatnie uruchomienie zostanie zaktualizowany do w toku, a następnie ukończony po pomyślnym uruchomieniu całego skanowania.
Zarządzanie skanowaniem
Skanowanie można zarządzać lub uruchamiać ponownie po zakończeniu:
Wybierz nazwę skanowania, aby zarządzać skanowaniem.
Na stronie historii skanowania możesz ponownie uruchomić skanowanie, edytować skanowanie lub usunąć skanowanie.
Możesz również ponownie uruchomić skanowanie przyrostowe lub pełne skanowanie.
Pochodzenie danych
Ogólnie rzecz biorąc, pochodzenie danych reprezentuje podróż, z której dane pochodzą z punktu początkowego do miejsca, w którym są przenoszone przez majątek danych w czasie. Wśród wielu zastosowań jest rozwiązywanie problemów, śledzenie głównej przyczyny w potokach danych i debugowanie.
Wykaz danych w Microsoft Purview łączy się z innymi platformami magazynu danych, przetwarzania i analizy w celu zbierania informacji o pochodzenia danych. W związku z tym wykaz zawiera ogólne środowisko pochodzenia specyficzne dla scenariusza.
Usługa Microsoft Purview obsługuje pochodzenie danych z usługi Azure SQL Database. Podczas konfigurowania skanowania można włączyć przycisk przełączania wyodrębniania pochodzenia, aby wyodrębnić informacje o pochodzenia.
Wymagania wstępne dotyczące konfigurowania skanowania przy użyciu wyodrębniania pochodzenia
Wykonaj kroki opisane w sekcji Uwierzytelnianie na potrzeby skanowania przy użyciu tożsamości zarządzanej, aby autoryzować usługę Microsoft Purview do skanowania bazy danych Azure SQL.
Zaloguj się do usługi Azure SQL Database przy użyciu konta Azure AD i przypisz odpowiednie uprawnienia (na przykład: db_owner) do tożsamości zarządzanej usługi Purview. Skorzystaj z poniższej przykładowej składni SQL, aby utworzyć użytkownika i udzielić uprawnień, zastępując ciąg purview-account nazwą konta.
SQLCREATE user <purview-account> FROM EXTERNAL PROVIDER GO EXEC sp_addrolemember 'db_owner', <purview-account> GOUruchom poniższe polecenie w usłudze Azure SQL Database, aby utworzyć klucz główny.
SQLCREATE MASTER KEY GO
Tworzenie skanowania z włączonym przełącznikiem wyodrębniania pochodzenia
Włącz przełącznik wyodrębniania pochodzenia na ekranie skanowania.
Wybierz metodę uwierzytelniania, wykonując kroki opisane w sekcji skanowania.
Po pomyślnym skonfigurowaniu skanowania z poprzedniego kroku nowy typ skanowania o nazwie Wyodrębnianie pochodzenia będzie uruchamiany co 6 godzin w celu wyodrębnienia pochodzenia danych z bazy danych Azure SQL. Pochodzenie jest wyodrębniane na podstawie rzeczywistej procedury składowanej uruchamianej w bazie danych Azure SQL.
Wyszukiwanie zasobów bazy danych Azure SQL i wyświetlanie pochodzenia środowiska uruchomieniowego
Możesz przeglądać wykaz danych lub przeszukiwać wykaz danych, aby wyświetlić szczegóły zasobów dla usługi Azure SQL Database, wykonując poniższe kroki:
Przejdź do karty Zasób —> pochodzenie danych, aby zobaczyć pochodzenie zasobów, jeśli ma to zastosowanie. Zapoznaj się z sekcją dotyczącą obsługiwanych możliwości w obsługiwanych scenariuszach pochodzenia bazy danych Azure SQL. Aby uzyskać więcej informacji na temat pochodzenia danych, zobacz przewodnik użytkownika dotyczący pochodzenia danych i pochodzenia danych.
Przejdź do zasobu procedury składowanej —> Właściwości —> powiązane zasoby, aby wyświetlić najnowsze szczegóły uruchamiania procedur składowanych
Wybierz hiperlink procedury składowanej obok pozycji Uruchomienia, aby wyświetlić Azure SQL Przegląd przebiegu procedury składowanej. Przejdź do karty właściwości, aby wyświetlić rozszerzone informacje o czasie wykonywania z procedury składowanej. Na przykład: executedTime, rowcount, Client Connection itd.