In dieser Lektion befinden sich 23 Karteikarten

Verteilung, Autonomie & Heterogenität

Diese Lektion wurde von tr64x erstellt.

Lektion lernen

  • Komplexitätsursachen der Datenintegration - Verteilung- Autonomie- Heterogenität ➔ Jede zu integrierende Datenquelle bzw. jedes zu integrierende AS besitzt spezifische, i.d.R. unterschiedliche Eigenschaften hinsichtlich dieser drei Dimensionen.➔ ...
  • Datenintegration: Verteilung Ein Datenbestand kann auf mehrere „Orte“ aufgeteilt sein
  • Datenintegration: Zwei Arten der Verteilung Physische Verteilung: Daten liegen auf physisch und damit meist auch räumlich getrennten SystemenLogische Verteilung: Inhaltlich identische Daten liegen in einem System an verschiedenen Stellen (Ausfallsicherheit ...
  • Horizontale & Vertikale Partitionierung (zu Arten ... Horizontale Partitionierung („zeilenbasierte“ Verteilung): Verteilung vollständiger „Dateneinheiten“ / Datensätze. Beispiel Kunden-Datensätze: Die Datensätze europäischer Kunden werden vollständig ...
  • Datenintegration: Autonomie Jede Datenquelle kann unabhängig von anderen Quellen über die von ihr kontrollierten / verwalteten Daten, deren Strukturierung und Ablage, sowie Zugriffsmöglichkeiten auf ihre Daten entscheiden. ➔ ...
  • Verschiedene Arten der Autonomie Designautonomie:- Datenquelle kann die Syntax und Semantik ihrer Daten frei festlegen Schnittstellenautonomie:- Datenquelle kann frei festlegen, mit welchen technischen Verfahren / Technologie auf die ...
  • Datenintegration: Heterogenität liegt vor wenn zwei AS nicht dieselben Methode, Modelle, Sprachen zur Strukturierung und Darstellung von und zum Zugriff auf die von ihnen verwalteten Daten anbieten oder syntaktisch identische Daten ...
  • Zusammenhang der Dim. Verteilung, Autonomie einerseits ... - Verteilung und Heterogenität sind prinzipiell unabhängig voneinander- Autonomie und Heterogenität sind prinzipiell unabhängig voneinander → Heterogenität besteht sowohl zwischen den Datenquellen ...
  • Arten der Heterogenität und ihre Ebene - Technische Heterogenität (Strukturebene)o Überwunden, wenn die Systeme technisch miteinander kommunizieren können - Datenmodell – Heterogenität (Strukturebene)o Überwunden, wenn dieselben Datenmodelle ...
  • Unterscheidung (zu Arten der Heterogenität) - systeminterner Strukturierung, Darstellung und Bedeutung von Daten („interne Repräsentation“ von Daten) und - systemexterner Strukturierung, Darstellung und Bedeutung von Daten („externe Repräsentation“ ...
  • Technische Heterogenität Zwei Systeme sind technisch heterogen, wenn sie sich hinsichtlich der von ihnen angebotenen bzw. unterstützten Möglichkeiten zum Datenzugriff unterscheiden
  • Vier Gesichtspunkte der technischen Heterogenität - AnfragemöglichkeitenMittels Anfragesprache, parametrisierbare Funktionsaufrufe (API, Webservice) oder Web Formularen- Anfragesprachen – z.B.: SQL, XQuery➔ Diese zwei werden auch als Schnittstellen ...
  • Datenintegration: Datenmodell – Heterogenität liegt vor, wenn zwei Systeme zur Strukturierung ihrer Daten unterschiedliche Datenmodelle verwenden. Es ist zwischen der Struktur aus fachlich / logischer Sicht, der Struktur aus technischer Sicht und ...
  • Sprachelemente (Datenmodell – Heterogenität) Unterschiedliche Datenmodelle besitzen unterschiedliche Sprachelemente mit unterschiedlicher Ausdrucksstärke und Bedeutung z. B. ER-Modell, Bereichsspezifische Datenmodell (eher Shemata), proprietäre ...
  • Strukturelle Heterogenität liegt dann vor, wenn zwei Schemata verschieden sind, obwohl sie denselben Ausschnitt der realen Welt abbilden /modellieren. Siehe Beispiel: objektorientiert <- transformation -> relational <- transformation ...
  • Wodurch entsteht strukturelle Heterogenität? Gründe? ... Durch die Tatsache, dass Quellsysteme hinsichtlich ihrer Entwurfsentscheidungen autonom sind (→ Designautonomie) Typische Gründe aus der Praxis:- Technische Rahmenbedingungen, die zur Wahl eines bestimmten ...
  • Syntaktische Heterogenität liegt vor wenn derselbe Sachverhalt formal unterschiedlich dargestellt wird Beispiele für unterschiedliche formale Darstellungen:- Untersch. Zahlendarstellungen: Binär, dezimal- Untersch. Zeichendarstellung ...
  • Semantische Heterogenität Def.: „Semantische Heterogenität liegt vor, wenn dieselbe Zeichenkette unterschiedlich interpretiert wird“ - Daten in einem AS besitzen keine inhärente Bedeutung- Daten werden durch Interpretation ...
  • Ursache für semantische Heterogenität (semantische ... Mit der Zeichenkette ist einerseits ein abstrahiertes Konzept in unserer Vorstellung verbunden, und zum anderen eine Menge von Objekten der realen Welt, die durch dieses Konzept beschrieben werden. Siehe ...
  • Semantisches Dreieck Zeichen(kette): Name/Begriff für "Etwas", Bennenung, Bezeichnung Extension: Umfang eines Begriffs, Gesamtheit der Gegenstände, die unter diesem Begriff fallen (Bedeutungsbereich) Intension: Begriffsinhalt ...
  • Häufig semantische Konflikte Synonym: Verschiedene Bezeichnungen / Namen bei gleicher Intension und Extension- Bsp. Auf Strukturebene: Darsteller / Schauspieler- Bsp. Auf Datenebene: EUR und € Homonym: Gleiche Bezeichnung / Namen ...
  • Was kann bei Auflösung semantischer Konflikte genutzt ... - Dokumentationen der Datenquellen, Informationen von Entwicklern oder Anwendern- Aber: Datenquellen sind meist autonom → Obige Informationen stehen nicht immer oder im benötigten Umfang bereit → ...
  • Ansätze zum Umgang mit semantischer Heterogenität ... 1. Vergleiche von Zeichenketten / Mustererkennung / Ableitung von Zusammenhängen aus dem Vorliegen „ähnlicher“ Attributwerte 2. Explizite Berücksichtigung des Kontexts von Daten bzw. Namen beim ...