Funktionsumfang
Integrierte Werkzeuge für umfassende Datenanalysen
AUDIPY ist ein vielseitiges Software-Werkzeug zur Analyse, Verarbeitung und Visualisierung strukturierter Datensätze. Es unterstützt Sie dabei, große Datenmengen effizient zu durchsuchen, zu filtern und gezielt auszuwerten – ganz ohne komplizierte Abläufe oder zusätzliche Tools.
Dank der flexiblen Architektur lassen sich komplexe Analysen ebenso einfach durchführen wie schnelle Auswertungen im Alltag. Im Folgenden erhalten Sie einen Überblick über die zentralen Funktionen, die AUDIPY zu einem leistungsstarken Werkzeug für Datenanalyse und Visualisierung machen.
Dank der flexiblen Architektur lassen sich komplexe Analysen ebenso einfach durchführen wie schnelle Auswertungen im Alltag. Im Folgenden erhalten Sie einen Überblick über die zentralen Funktionen, die AUDIPY zu einem leistungsstarken Werkzeug für Datenanalyse und Visualisierung machen.
GRUNDLAGEN, DATEIVERWALTUNG UND IMPORT
Unterstützte Dateiformate
- Parquet – Hochoptimiertes Spaltenformat (Standardformat)
- Excel – XLSX, XLSB, XLS (alle Versionen)
- CSV / TXT – Automatische Zeichensatz- und Trennzeichenerkennung
- XML – Strukturierte Datenimporte
- JSON – Unterstützung für verschachtelte Strukturen
- DBF – DBase-Dateien
- ORC – Apache ORC Format
- Power BI – Direkte Extraktion aus PBIX-Dateien
Datenbank-Konnektoren
- Microsoft SQL Server – Mit Windows-Authentifizierung
- Oracle Database – Alle Versionen unterstützt
- MySQL & MariaDB – Volle Kompatibilität
- PostgreSQL – Native Unterstützung
- SQLite – Eingebettete Datenbanken
- Microsoft Access – MDB/ACCDB via ODBC
- ODBC – Verbindung zu beliebigen Datenquellen
- SSL/TLS-Verschlüsselung für sichere Verbindungen
Import-Assistenten
- Data-Wizard für CSV/TXT mit Vorschau und Trennzeichen-Erkennung
- Ignorieren von Kopf- oder Fußzeilen, Zeichensatzwahl (UTF-8, ISO, etc.)
- Excel-Wizard mit Smart Merge und automatischer Header-Erkennung
- Zusammenführen mehrerer Tabellenblätter
- Report-Wizard zur Extraktion aus PDF-Dateien
- Datenbank-Wizard mit SQL-Query-Builder
- Verbindungstest und Fehlerdiagnose integriert
Spezial-Importe
- GoBD-konformer XML-Import (Index.xml mit Referenzen)
- SAP DART-Dateien – Automatischer Strukturimport
- XRechnung – Extraktion und Visualisierung
- Power BI Integration – Zugriff auf DAX & M Queries
- Batch-Import – Mehrere Dateien gleichzeitig einlesen
- Ordner-Import – Rekursive Verarbeitung kompletter Verzeichnisse
Explorer & Projektmanagement
- Hierarchischer Dateiexplorer mit Baumansicht
- Projekt- und Fallverwaltung mit schnellem Wechsel
- Datenherkunft – Nachverfolgung von Ableitungen
- Erstellung und Verwaltung eigener Ordnerstrukturen
- Mehrere Dateien gleichzeitig geöffnet (Tab-System)
- Drag & Drop – Dateien direkt importieren
DATENEXPLORATION UND INTERAKTION
Spaltenformatierung
- Automatische Erkennung und Konvertierung von Datumsformaten
- Unterstützung für Unix-Zeitstempel und Excel-Seriennummern
- Zahlenformate – Ganzzahlen, Dezimalzahlen, EU/US-Trennzeichen
- Tausendertrennzeichen, Prozent- und Währungsdarstellung
- Formatierung für Text, Boolean und Hyperlinks
- Konfigurierbare Dezimalstellen und Anzeigepräzision
Spalten- und Zeilenaktionen
- Spalten duplizieren, umbenennen, löschen oder ausblenden
- Neuordnung per Drag & Drop mit automatischem Speichern
- Spaltenbreiten individuell anpassen und dauerhaft speichern
- Sortierung nach einer oder mehreren Spalten
- Zellinhalte kopieren – einzeln oder blockweise
- Editierbare Spalten – direkte Bearbeitung in der Tabelle
- Zeilen hinzufügen oder löschen im Editiermodus
Erweiterte Filterung
- Einfache Filter – Gleich, Ungleich, Enthält, Beginnt mit, Endet mit
- Bereichsfilter – Größer als, Kleiner als, Zwischen
- Datumsfilter – Jahr, Monat, Woche, Wochentag oder Zeiträume
- Fuzzy-Filter – Ähnliche Werte mit konfigurierbarer Genauigkeit
- Mehrwert-Filter – Auswahl mehrerer Werte (In / Nicht In)
- UND/ODER-Logik – Kombination mehrerer Filterbedingungen
- Filter-Lesezeichen – Speichern, Benennen und Wiederverwenden
Spaltenstatistiken
- Summe, Mittelwert, Median, Minimum und Maximum
- Standardabweichung, Varianz und Quantile (25%, 50%, 75%)
- Eindeutige Werte – Häufigkeits- und Kardinalitätsanalyse
- Nullwerte – Erkennung und prozentuale Darstellung
- Typadaptive Statistik – Automatische Erkennung von Text, Zahl oder Datum
- Inline-Anzeige statistischer Ergebnisse in Tabellen
Externe Aktionen & Integration
- Google-Suche – Direkter Start mit Zellinhalt
- Google Übersetzer – Übersetzung markierter Inhalte
- Google Maps – Interaktive Adresssuche und Kartenansicht
- XRechnung-Visualisierung – Anzeige strukturierter Rechnungsdaten
- Verknüpfung mit externen Parquet-Dateien (Cross-File Lookup)
- Start externer Anwendungen aus Kontextmenüs
- Ausführung eigener Python-Skripte oder Analysen
Benutzeroberfläche & Interaktion
- Mehrsprachige Oberfläche – Deutsch, Englisch, Niederländisch
- Design-Themes – Hell, Dunkel, Benutzerdefiniert
- Zebramuster – Abwechselnde Zeilenfarben für bessere Lesbarkeit
- Schriftgröße anpassbar, DPI-Skalierung für hochauflösende Displays
- Kontextmenüs mit Schnellzugriff auf alle Tabellenfunktionen
- Responsive Layouts für verschiedene Bildschirmgrößen
DATENBEARBEITUNG UND TRANSFORMATION
Stream-Verarbeitung
- Verarbeitung sehr großer Datenmengen in Teilabschnitten
- Deutlich reduzierter Speicherverbrauch dank Streaming
- Stream-Extraktion – Echtzeit-Filterung während des Imports
- Stream-Gruppierung – Aggregation ohne Speicherüberlauf
- Stream-Verbindung (Join) großer Dateien
- Stream-Anhängen – Zusammenführung vieler Dateien
- Stream-Pivot – Erstellung großer Kreuztabellen im Stream
- Basierend auf DuckDB – Höchste Performance und Effizienz
Datenverbindungen (Joins)
- Inner Join – Nur übereinstimmende Datensätze
- Left Join – Alle Datensätze aus der linken Tabelle
- Right Join – Alle Datensätze aus der rechten Tabelle
- Full/Outer Join – Alle Datensätze beider Tabellen
- Anti Join – Nur nicht übereinstimmende Datensätze
- Fuzzy Join – Ähnlichkeitsbasiertes Matching
- Join über mehrere Schlüsselspalten
- Append / Concatenate – Tabellen zeilenweise anfügen
Datenbereinigung
- Duplikate finden und automatisch entfernen
- Leere Zeilen löschen – komplett oder teilweise
- Fehlende Werte auffüllen (Forward/Backward Fill, Mittelwert, Median)
- Ausreißer-Erkennung mit statistischen Verfahren
- Validierung von Datentypen – automatische Korrektur
Spaltentransformation
- Zusammenführen (Merge) – Spalten mit Trennzeichen kombinieren
- Teilen (Split) – Nach Trennzeichen, Länge oder Muster
- Extrahieren – Nur Zahlen, Text oder per RegEx
- Ersetzen – Teilstring oder exakte Übereinstimmung
- Text-Operationen – Trimmen, Umwandlung in Groß-/Kleinschreibung
- Datum-Operationen – Jahr, Monat, Tag oder Zeitkomponenten extrahieren
Aggregation & Pivot
- Gruppierung nach einer oder mehreren Spalten
- Standard-Aggregationen – Summe, Durchschnitt, Anzahl, Min, Max
- Erweiterte Aggregationen – Median, Varianz, Standardabweichung
- Pivot-Tabellen – Flexible Kreuztabellen mit Mehrfachwerten
- Drill-Down – Interaktive Detailansicht in Pivot-Ergebnissen
- Benutzerdefinierte Berechnungen und Gruppierungen
Berechnete Spalten
- Formel-Editor mit Echtzeit-Vorschau
- Mathematische Operatoren (+, -, *, /, %, Potenz)
- Statistische Funktionen – Mittelwert, Median, Standardabweichung
- Datum/Zeit-Differenzen – Berechnung von Zeitabständen
- Lag/Lead – Bezug auf vorherige oder nächste Zeile
- Wenn-Dann-Funktionen – Beliebig verschachtelbare Bedingungen
- Kumulative Summen mit Gruppierung
- Volle Unterstützung für Python-Ausdrücke
Neue Spalten
- Editierbare Textspalten für manuelle Eingaben
- Editierbare numerische Spalten für Berechnungen
- Index-Spalte – Laufende Nummerierung
- Prüfspalte – Manuelle Markierungen (✔, ✖ oder leer)
- Konstante Spalte – Feste Werte für alle Zeilen
Vergleich & Differenzanalyse
- Tabellenvergleich – Zwei Datensätze direkt gegenüberstellen
- Zeilenweise Analyse – Hinzugefügte, entfernte, geänderte Einträge
- Spaltenweise Unterschiede – Feldänderungen sichtbar machen
- Diff-Report – Übersichtliche Änderungszusammenfassung
- Export der Unterschiede in Excel
KI-FUNKTIONEN (ASK MY DATA – AMY)
KI-Chat Interface
- Ask my Data (AMY) – Fragen in natürlicher Sprache stellen
- Antworten als Text, Tabelle oder interaktive Diagramme
- Automatische Python-Code-Generierung für Analysen
- Fehlerkorrektur und Verbesserungsvorschläge für Code
- Kontextbewahrung – Folgefragen und mehrstufige Dialoge
Unterstützte KI-Modelle
- AUDIPY AI – DSGVO-konform, vollständig datenschutzsicher
- OpenAI – diverse Modelle (optional integrierbar)
- Deepseek - Diverse Modelle
- GPT4All – Lokale Modelle ohne Internetverbindung
- Custom APIs – Anbindung eigener Endpunkte
- Bei AUDIPY AI: Nur Metadaten (z. B. Spaltennamen) werden verarbeitet
- Keine sensiblen Dateninhalte verlassen das System
Intelligente Prompt-Generierung
- Magic Prompt Generator – Kontextabhängige Analysevorschläge
- Berücksichtigung von Branche, Dateninhalt und Systemkontext
- Automatische Prüfung der Datenqualität – Fehlende Werte, Duplikate
- Ausreißer- und Anomalieerkennung
- Verteilungsanalyse zur Erkennung von Datenmustern
- Dynamische Vorschläge für Folgeabfragen
KI-gestützte Spaltenerstellung
- KI-Spalten Generator – Neue Spalten automatisch erstellen
- Komplexe Transformationen ohne Programmierkenntnisse
- Extraktion von Textmustern per KI-Analyse
- Named Entity Recognition (NER) – Erkennung von Personen, Orten, Organisationen
- Automatisierte Berechnung kontextbezogener Werte
KI-Visualisierung & Insights
- Automatische Diagramm-Generierung – Optimal passendes Chart auswählen
- Insight-Generierung – Wichtige Erkenntnisse werden hervorgehoben
- Trend-Erkennung – Identifikation von Entwicklungen im Datensatz
- Anomalie-Erklärung – KI liefert Begründungen zu ungewöhnlichen Werten
- Visuelle Storyboards – Automatisch generierte Analysen als Bericht
Dokumentation & Weitergabe
- AMY-Lesezeichen – KI-Abfragen speichern und erneut ausführen
- Automatische Dokumentation aller durchgeführten KI-Analysen
- Python-Code einsehen, bearbeiten und exportieren
- Interaktive Diagramme als HTML oder PNG speichern
- Reproduzierbare Workflows – Analysen exakt wiederholbar
DATENANALYSE UND VISUALISIERUNG
Deskriptive Statistik
- Eindeutige Werte (alle Spalten) – Primärschlüssel identifizieren
- Eindeutige Werte (Spalte) – Häufigkeitsanalyse
- Fehlende Werte (Missing Values) – Datenvollständigkeit prüfen
- Werteverteilung – Prozentuale und absolute Häufigkeiten
- Quartile – 25%, 50%, 75% Perzentile
- Zusammenfassung – Alle wichtigen Kennzahlen auf einen Blick
Ausreißeranalyse (Anomalien)
- Isolation Forest – KI-basierte Erkennung von Ausreißern
- Z-Score und Modified Z-Score – Klassische statistische Methoden
- Rolling Z-Score – Optimiert für Zeitreihen
- Automatischer Modus – Wählt beste Methode je nach Datentyp
- Kategoriebasierte Analyse – Gruppenspezifische Bewertung
- Interaktive Visualisierung – Darstellung mit rollierendem Median
Verteilungsanalyse
- Histogramm mit verschiedenen Bin-Methoden (Sturges, Rice, Scott, Freedman-Diaconis)
- Kernel Density Estimation (KDE) – Glatte Dichteverteilung
- Box-Plot und Violin-Plot – Quartile und Verteilung vergleichen
- Vergleich mit theoretischer Normalverteilung
- Kategoriebasierte Overlays – Mehrere Gruppen in einer Ansicht
Zeitreihenanalyse
- Seasonal Decomposition – Zerlegung in Trend, Saisonalität und Restwerte
- Trend- und Mustererkennung über Zeit
- Rolling Averages – Gleitende Durchschnitte
- Liniendiagramme und Flächendiagramme zur Verlaufsgrafik
- Saisonale Vergleichsansichten über mehrere Perioden
Benford-Analyse (Ziffernanalyse)
- Forensische Methode zur Erkennung potenzieller Manipulationen
- Erste, zweite und kombinierte Ziffernprüfung
- Einerstellenprüfung – Letzte Ziffern validieren
- Kategoriebasierte Benford-Analyse – Gruppierte Prüfungen
- Visuelle Darstellung von Abweichungen zur Benford-Verteilung
Lückenanalyse
- Prüfung der Vollständigkeit sequenzieller Nummernkreise
- Rechnungsnummern auf Lücken und Doppelte prüfen
- Gruppierte Nummernkreise nach Präfix oder Kategorie
- Reset-Felder für periodische Nummern (z. B. jährlich)
- Timeline-Visualisierung zur Darstellung von Lücken
Erweiterte Visualisierungen
- Netzwerkdiagramme – Beziehungen zwischen Entitäten
- Sankey / Money Flow – Darstellung von Geldflüssen
- Parallele Koordinaten – Multidimensionale Datenanalyse
- Streudiagramme – Korrelationen zwischen Variablen
- Balken- und Liniendiagramme – Anteile und Kategorien visualisieren
Interaktive Charts
- Plotly-basierte interaktive Visualisierungen
- Zoom, Pan und Auswahlfunktionen direkt im Diagramm
- Hover-Tooltips mit Detailinformationen
- Export in interaktiver HTML oder statistischen Bild (png)
AUDIT, COMPLIANCE UND ERWEITERTE FUNKTIONEN
Audit Trail & Reproduzierbarkeit
- Audit Steps – Wiederverwendbare, standardisierte Prüfschritte
- My Audit Manager – Verwaltung von Prüfungsabläufen
- Eigene Prüfschritte definieren und speichern
- Python-Skripte für automatisierte Prüfungen
- Automatische Dokumentation aller Aktionen
Monetary Unit Sampling (MUS)
- Stichprobenplanung nach Poisson, Alpha-Beta und Hypergeometrisch
- Kumulative Wertauswahl – Systematische Ziehung
- Stichproben-Evaluation mit verschiedenen Methoden
- Tainting & Extrapolation – Hochrechnung auf Grundgesamtheit
- Reproduzierbar dank Seed-Werten
- PDF-Report zur Dokumentation
Lesezeichen-System
- Analyse-Lesezeichen – Komplette Ansichten speichern
- Filter-, Pivot- und Chart-Lesezeichen wiederverwenden
- Notizen und Beschreibungen für jeden Eintrag
- Farbmarkierungen zur Kategorisierung
- Schneller Zugriff über das Dashboard
Datenintegrität & Sicherheit
- Hash-Chain-Technologie – Unveränderbarkeit garantieren
- SHA-256, MD5 und xxHash – Kryptografische Prüfsummen
- Signatur-Verifikation – Datenherkunft sicherstellen
- Verlaufsbericht – Vollständige Änderungshistorie
- Metadatenverwaltung – Erweiterte Dateninformationen speichern
- Verschlüsselte API-Keys für sichere Integration
Export & Reporting
- Parquet-, CSV- und Excel-Export mit Formatoptionen
- PDF-Reports mit integrierten Visualisierungen
- HTML-Export – Interaktive Berichte als Webseite
- Power BI Export – PBIX-Dateien direkt erzeugen
- Spaltenauswahl für gezielten Export
- „What you see is what you get“ – Filter werden übernommen
Stichprobenverfahren
- Zufalls- und systematische Stichproben
- Geschichtete Stichproben nach Kategorie
- Wertproportionale Auswahl (MUS) – Risikobasiert
- Reproduzierbare Ergebnisse durch Seed-Werte
- Automatische Berechnung des Stichprobenumfangs
Entwicklermodus & Erweiterte Funktionen
- Metadaten-Verwaltung – Auslesen, Löschen, Ersetzen
- Python-Integration für individuelle Automatisierungen
- Debug-Logging für detaillierte Fehleranalyse
- Feature-Toggles – Experimentelle Funktionen aktivieren
Compliance-Unterstützung
- GoBD-konform – Erfüllt deutsche Buchführungsstandards
- DSGVO-konform – Datenschutz vollständig gewährleistet
- Revisionssicher – Unveränderbare Dokumentation
- Vollständiger Audit Trail für Nachvollziehbarkeit
- Privacy by Design – Datenschutz von Anfang an integriert
PERFORMANCE & SKALIERBARKEIT
Big Data Handling
- Streaming Operations – Verarbeitung großer Datenmengen ohne vollständiges Laden
- DuckDB-Integration – In-Memory-Analytics für Millionen von Zeilen
- Chunked Processing – Verarbeitung in flexiblen Blöcken
- Intelligentes Memory Management – Automatische Speicherbereinigung
- Lazy Loading – Laden nur der aktuell benötigten Daten
- Column Selection – Einlesen ausschließlich relevanter Spalten
Asynchrone Verarbeitung
- Background Processing – UI bleibt während der Verarbeitung reaktionsfähig
- Multi-Threading – Parallele Ausführung von Aufgaben
- Ressourcenmanagement – Automatische Freigabe ungenutzter Speicherbereiche
Visualisierung großer Datenmengen
- Figure Resampling – Automatische Datenpunktreduktion für hohe Performance
- Zoom-basierte Aggregation – Detaillierte Ansicht bei Vergrößerung
- Interactive Downsampling – Flüssige Navigation ohne Detailverlust
- Effizientes Rendering – Optimierte Darstellung auch bei Millionen Punkten
- GPU-beschleunigte Visualisierung – Maximale Performance bei hoher Auflösung

