winfo (Fach) / Kap. 4 (Lektion)

In dieser Lektion befinden sich 18 Karteikarten

Daten und Datenbanken

Diese Lektion wurde von annesophiasch erstellt.

Lektion lernen

Diese Lektion ist leider nicht zum lernen freigegeben.

  • Daten? Datenverarbeitung Datenschutz  Datenmissbrauch Datendiebstahl Datenskandal  Datenflut Datendiebstahl Datenträger Datenverlust  Datenbank  Suchmaschine Datenauswertung  Informationsgewinnung Datensammler  Datensicherheit Datengrundlage  Wissensmanagement 
  • 3 Beispiele von Web-Anwendungen, die auf Datenbanken zugreifen: IMDb Google Amazon
  • Was sind Daten? Daten sind mittels Ordnungsregeln (Syntax) zusammengefügte Zeichen Ist der Kontext bekannt, erlangen diese Daten eine Bedeutung und können zu Informationen werden Informationen sind Nachrichten, die das Wissen des Akteurs verändern Zeichen -(Syntax)-> Daten -(Semantik)-> Informationen -(Menschl. Infoverarbeitung)-> Wissen
  • Daten im Unternehmen Daten fallen in allen Bereichen einer Unternehmung an. Daten sind der "Rohstoff" für Informations- und Entscheidungsprozesse sowie Entstehung von Wissen Daten...beziehen sich z.B. auf Artikel & Teile, Aufträge, Arbeitsplätze, Verbrauchs-/Zahlungsvorgänge, Eigenschaften & Verhaltensweisen v. Kunden & Lieferanten Logische Datenorganisation:... Daten werden strukturiert, d.h. hinsichtlich Zusammenhänge analysiert & geordnet Physische Datenorganisation:...Daten werden auf peripheren Speichern (Festplatten, Magnetbändern, DVDs, etc) gespeichert + für Zugriff bereit gehalten
  • Klassifizierung von Daten Daten können als Folge maschinell verarbeitbarer Zeichen verstanden werden die Objekte und Objektbeziehungen der Realwelt durch ihre Merkmale beschreiben und damit repräsentieren Klassifizierung von Daten möglich nach: Zeichenart bzw. Datentyp: Numerische, alphabetische, alphanumerische Daten  Erscheinungsform: Akustische, bildliche, schriftliche Daten  Formatierung: Formatierte, unformatierte Daten  Stellung im Verarbeitungsprozess: Eingabe- und Ausgabedaten  Verwendungszweck: Stammdaten (z.B.Name,Adresse), Bewegungsdaten (z.B. Lagerzu- und -abgänge), Transferdaten (zur Weiterverarbeitung durch andere Programme) 
  • Grundbegriffe der Datenorganisation Datenfeld oder Datenelement: Kleinste logische Dateneinheit, auf die zugegriffen wird.  Inhaltlich zusammenhängende Datenfelder werden zu Datensätzen zusammengefasst. Alle gleichartigen Datensätze werden in einer Datei gespeichert.  --> GRAFIK: Datensatz: besteht aus Artikelnummer, Artikelname, Warengruppe, Artikelpreis Datenfeld = Artikelnummer, (bzw. Artikelname, etc...) Datei = Datensätze & Datenfelder (gleichartig)
  • Grundbegriffe der Datenorganisation II Datenbank (DB):Sammlung logisch zusammengehörender Dateien, die auf einem Trägermedium gespeichert sind Datenbanksystem (DBS):besteht aus Datenbank und zugehörigen Routinen zu ihrer Verwaltung --> Datenbankmanagementsystem (DBMS) Schlüssel-Zur eindeutigen Unterscheidung von Datensätzen in einer Datenbank -Besteht aus einem / mehreren Datenfeldern, die Datensatz eindeutig identifizieren-Primärschlüssel (!) dient eindeutigen Identifizierung der Datensätze-->künstliche (systemfreie) Primärschlüssel, z.B. Personalnummer / Automobilkennzeichen-Alle Schlüssel, die NICHT Primärschlüssel sind = Sekundärschlüssel
  • Datei - vs. Datenbankorganisation Dateiorganisation -->GRAFIK Die Programme greifen auf eigene, phsysisch vorhandene Dateien zu (Programmabhängig) Datei B ist redundant (öfters / 2x vorhanden) Keine zentrale Datenverwaltung
  • Datei - vs. Datenbankorganisation Datenbankorganisation Das DBMS stellt den Programmen die jeweils erforderlichen logischen Dateien zur Verfügung Physisch sind Daten redundanzfrei & konsistent in DB abgelegt Vorteile: Trennung der logischen Datenstrukturierung von der physischen Datenspeicherung Unabhängigkeit der Daten von den einzelnen Programmen, die auf sie zugreifen --> GRAFIK
  • Abstraktionsebenen bei Formulierung von Daten und Datenbeziehungen: DREI-EBENEN-ARCHITEKTUR Interne Sicht:2 Datenspeicheraus denen die Physische Datenorganisation hervorgeht Konzeptionelle Sicht:Logische Datenorganisation Externe Sicht:Anwendungsprogramm D1, ... Anwendungsprogramm Dm (Dialogbetrieb)                  -Benutzer 1, ... Benutzer mAnwendungsprogramm S1, ... Anwendungsprogramm Sm (Stapelbetrieb)
  • Anforderungen an Datenbanksysteme Logische Datenunabhängigkeit zwischen Schema und Anwendungsprogrammen/Anwendern sowie physische Datenunabhängigkeit zwischen Schema und physischer Datenorganisation  Begrenzung von Redundanz auf kleinstmögliches Maß durch entsprechende Datenstruktur   Erhaltung des gleichen Änderungsstands bei mehrfach gespeicherten Datenbeständen (Datenkonsistenz)  Datenbankintegrität (Korrektheit/Vollständigkeit der Daten): Vermeidung von Fehleingaben und unzulässigen Operationen (semantische Integrität) sowie Vermeidung von Fehlern, wenn mehrere Anwender auf gleiche Datenbestände zugreifen (operative Integrität)  Bewahrung der Daten vor Verfälschung, Vernichtung und unberechtigtem Zugriff (Datensicherheit) sowie Verhinderung der unberechtigten Verwendung von Daten (Datenschutz)  Ausfallsicherheit: Routinen zur Wiederherstellung der Datenkonsistenz nach Fehler im Datenbankbetrieb (z.B. Rechnerabsturz oder Festplattencrash) 
  • Vor Implementierung in Datenbank ... Relationale Datenbanken Vor der Implementierung einer Datenbank sind zwei Schritte erforderlich-Datenmodellierung-Transfer in geeignetes Datenmodell Datenmodellierung:-Möglichst exakte Beschreibung des in der Datenbank abzubildenden Realitätsausschnittes-Ableitung von sachlogischen Objekten (z.B. Kunden- & Artikeldaten) und den zwischen diesen Objekten existierenden Beziehungen (z.B. Kunde kauft Artikel)-Standardansatz: Entity Relationship Model Transfer in Datenbankmodell: -Verschiedene Datenbankmodelle (rational, hierarchisch, Netzwerk,...)-Am weitesten verbreitet: Relationales Datenbankmodell
  • Relationale Datenbanken Zentrales Strukturelement = Relation Darstellung von Relationen in zweidimensionaler Tabelle mit fester Anzahl von Spalten und beliebiger Anzahl von Zeilen Die Zeilen (Datensätze) werden als Tupel bezeichnet Ein Tupel entspricht im Entity-Relationship-Model einem Entity Jedes Tupel muss einen Primärschlüssel besitzen Attribute einer Relation stehen in den Spalten Als Abfragesprache meist SQL
  • Data Warehouse Daten in operativen Datenbanken i.d.R. Momentaufnahmen des aktuellen Geschehens Zur Entscheidungsfindung sowie für weitere Datenanalysen werden jedoch häufig benötigt:-Daten über breiten Unternehmensausschnitt -Daten über längeren Zeitraum -Daten aus Unternehmensumfeld (z.B. aus Marktforschung) Lösung: Aufbau eines Data Warehouse, bestehend aus -Datenmanagement: zur Bereitstellung & Transformation der unterschiedlichen Daten -Datenorganisation: Definiert Speicherung & Zugriffsmöglichkeiten -Auswertung / Aufbereitung: Zur Untersuchung der Datenbestände (zum Erkennen von Zusammenhängen & Mustern in großen Datenmengen)
  • Architektur Data Warehouse siehe Skript!!!
  • Walmart als Beispiel für Data Warehouse Mehrere hundert tausend Terabyte >20.000 Anfragen täglich Analysen meist auf Shop-Ebene Ziele: Warenkorbanalyse, Kundensegementierung, etc. Bspe: Erkennung von Ladenhütern / Verkaufsschlagern Standortanalyse zur Einschätzung der Rentabilität von Niederlassungen Untersuchungen der Wirksamkeit von Marketing-Aktionen Analyse / Planung von Zwischenlagern
  • Informationsgewinnung mittels Online Analytical Processing (OLAP) Neben hoch komplexem Data-Mining, ist OLAP die wichtigste Technologie für Data-Warehouse und für Management-Support-Systeme Wesentliche Inhalt von OLAP wird durch Abkürzung FASMI beschrieben.FASMI = Fast Analysis of Shared Multidimensional Information Im schnellen (fast) und im Mehrbenutzerbetrieb (shared) nutzbaren Zugriff soll für Führungskräfte eine umfassende & mehrdimensionale Analyse aller betrieblichen Informationen möglich sein OLAP wird häufig mit einem Würfel verglichen, der nach allen Seiten drehbar ist & relevante Dimensionen abdeckt Als Navigation kann man beliebige Schnitte durch den virtuellen Würfel durchführen.Drill-Down-Verfahren: von hoch aggregierten Ebenen zu detaillierten Ebenen vorstoßen
  • Navigation in einer multidimensionalen OLAP-Datenbank zur Analyse von Daten Pivotierung / Rotation:-Beim Pivotieren werden Dimensionen des Würfels getauscht-->Anstelle Betrachtung von Umsätzen im Zeitverlauf, kann Umsatz nach Produktgruppe dargestellt werden Drill-down & Roll-up:-Daten werden disaggregiert-->Nach dem Drill-down des Jahresumsatzes einer Produktgruppe in DE über die Dimension Zeit, werden Quartalsumsätze gezeigt-Roll-up: Daten werden entlang einer Dimension verdichtet Slice & Dice-Eine Scheibe (Slice) wird aus dem Würfel herausgeschnitten, in dem ein Element einer Dimension selektiert wird-->Nur die Umsätze von April über alle Produkte & Regionen-Ad-hoc-Sicht eines eingeschränkten Datenbereichs (Dice)-->Umsätze der Produkte "Dienstleistungen" in der Region "Deutschland" im April.