מדריך איך לבנות ספריית נתונים לאומית

ספריית הנתונים הלאומית (NDL) היא מרכיב מרכזי בתוכנית הפעולה של ממשלת בריטניה להזדמנויות בתחום הבינה המלאכותית.

ספריית הנתונים הלאומית (NDL) היא מרכיב מרכזי בתוכנית הפעולה של הממשלה להזדמנויות בתחום הבינה המלאכותית. בלב ליבה, הממשלה מזהה חמישה מערכי נתונים ציבוריים בעלי השפעה גבוהה שיהפכו לנגישים לסוכנויות ממשלתיות, עסקים וחוקרים, ויאפשרו חדשנות בתחום הבריאות, פיתוח מדיניות ושירותים ציבוריים.

השאלות הן כיצד בונים אחת ומה אנחנו בונים?

תקדים לספריית נתונים לאומית

הדעות חלוקות לגבי אופן בניית NDL. אסכולה אחת טוענת שזו צריכה להיות פלטפורמת נתונים מבוזרת ומאוחדת המחברת נתונים קיימים ומקלה על חילופי נתונים, מבלי לאחסן נתונים באופן מרכזי. אסכולה אחרת טוענת שזו צריכה להיות מאגר נתונים מרכזי.

ה-UK Biobank הוא דוגמה לאחרון. הוא מחזיק חצי מיליון נתוני בריאות של אנשים אליהם ניתן לגשת על ידי חוקרים אקדמיים, עסקיים, צדקה וממשלתיים מורשים. שקיפות בשימוש בנתונים, אמצעי אבטחה חזקים ואמון הציבור באמצעי ההגנה היו המפתח להצלחתה.

פלטפורמת X-Road של אסטוניה היא דוגמה לכך. X-Road היא הטכנולוגיה העומדת בבסיס תוכנית זהות דיגיטלית לאומית. היא מאפשרת חילופי נתונים חלקים בין סוכנויות ממשלתיות תוך שמירה על אחסון נתונים מבוזר. המערכת מאפשרת לאסטונים לתקשר ללא מאמץ עם שירותים ציבוריים, החל מבריאות ועד מיסוי, חוסכת זמן ומשפרת את היעילות.

הלקחים מהפלטפורמה מחזקים את הצורך ביכולת פעולה הדדית, כמו גם את החשיבות של הבטחת פגיעה בנתונים ושהם מאובטחים. חשוב לציין, היא גם ממוקדת במשתמש ופועלת על פי "עקרון פעם אחת בלבד". אזרחי אסטוניה לא צריכים לדעת שזה עובד, רק שזה עובד. ולספק את הנתונים שלהם רק פעם אחת, שמתעדכנים אוטומטית בכל המערכות הרלוונטיות.

יסודות איתנים הם המפתח לבניית ספרייה

ספריית הנתונים הלאומית המוצעת תהיה פרויקט איחוד הנתונים הגדול ביותר שבוצע אי פעם על ידי מדינה כלשהי. ללא קשר למה שהוא מכיל ולאופן השימוש בו, היסודות זהים: נתונים איכותיים ואמינים.

מאמצי הטרנספורמציה הדיגיטלית ב-NHS הם דוגמה מושלמת למורכבות של ניהול נתוני אב מודרניים. מערכת הבריאות שלנו מכילה את מערך הנתונים הגדול ביותר בתחום הבריאות בעולם, אשר יהווה מרכז הולם באוסף של ה-NDL. למרות ש-NHS מכונה יחיד – 'NHS', זהו אוסף של מחלקות, ארגוני הזמנת וספקי שירותי בריאות, אזורים ומערכות.

המורכבות גוברת עוד יותר ככל שהוא צריך לתאם טיפול בין רשויות מקומיות ושירותי רווחה, במיוחד ככל שהאוכלוסייה שלנו מזדקנת ויוצרת לחץ על בתי החולים.נתוני מטופלים מבודדים כיום במערכות מדור קודם, מקוטעים לעתים קרובות ללא פורמטים ו/או סטנדרטים משותפים של נתונים, ולעתים קרובות אינם שלמים, מיושנים ו/או לא מדויקים. כל אלה גורמים באופן קבוע לרשומות כפולות במאגרים שונים (מבודדים). המטרה של שירות הבריאות הלאומי (NHS) היא ליצור תמונה אחת של האמת על ידי התאמת נתונים בין מקורות נתונים מרובים אלה.

אתגר הטרנספורמציה המודרנית של ניהול נתונים

ניהול נתוני אב מסורתי טומן בחובו בעיית איכות נתונים אינהרנטית. מודלים אלה לוקחים זמן רב כדי לקלוט הזנות של מערכות מקור, שלעתים קרובות סובלים מבעיות איכות נתונים. הם גם מסתמכים על התאמת נתונים, אשר משווה כל מחרוזת נתונים ומיישמת ניקוד על פניה כדי ליצור התאמה רשומה לרשומה.

מנועי התאמה הסתברותיים אלה משתמשים באלגוריתמים שמעריכים ומדרגים את ההתאמות. כל זה אינו אידיאלי עבור רשומות מטופלים שיש להן מספר וריאציות, מכיוון שייתכן שיש להן תכונות מזהות מרובות. וריאציות בנתונים אישיים – כגון חוסר עקביות בשמות (למשל, אלייזה לעומת אליזבת) – עלולות לגרום להתאמות לא מדויקות, מה שמקשה על יצירת רשומה אחת ומדויקת עבור כל אזרח.

גישה חזקה יותר לניהול נתוני מטופלים ואזרח, החיונית לאיחוד נתונים בין סילואים, היא פתרון ישויות (ER). ER משתמשת במודל סכמתי-אגנוסטי כדי לחסוך לצוותי הנדסת נתונים זמן וכסף הנדרשים מביצוע המרות נתונים ראשוניות. ER ממנפת את כל הרשומות הזמינות כדי ליצור את הייצוג המדויק ביותר האפשרי של נתוני הפרט, ממזערת שגיאות ומשפרת את אמינות מערכי הנתונים הממשלתיים.

חשוב מאוד עבור מערכי נתונים של המגזר הציבורי שנוספים אליהם כל הזמן, ER מאפשר רענון נתונים מתמיד עבור כל היישומים והשירותים הבנויים על גבי הפלטפורמה.

לקחים מ-NHS עבור ספריית הנתונים הלאומית

פלטפורמת הנתונים המאוחדת (FDP), המיושמת כעת על ידי NHS אנגליה, מספקת הצצה לאופן שבו ספריית הנתונים הלאומית יכולה לתפקד. ה-FDP צובר נתוני בריאות מקומיים כדי לאפשר טיפול מהיר ומתואם יותר ברמה האזורית, תוך צמצום חוסר היעילות הנגרם ממערכות מקוטעות.

אם תורחב, פלטפורמת נתונים בקנה מידה ארצי תוכל לאחד רשומות בריאות ברחבי NHS, ולאפשר גישה לתיק מטופל יחיד דרך אפליקציית NHS. גישה זו מכירה בכך שאזרחים מקבלים שירותים ציבוריים מרובים באזורים שונים, דבר המחייב מסגרת שיתוף נתונים חלקה.

שיפור שירותים ציבוריים באמצעות שיתוף נתונים הקשרי

כפי שצוין,גישת הממשלה לספריית הנתונים הלאומית תתמקד בזיהוי חמישה מערכי נתונים ציבוריים מרכזיים שיכולים להשיג את ההשפעה המיידית ביותר. עם זאת, נתונים לבדם אינם בעלי ערך ללא אסטרטגיה ברורה ליישומם.

דוגמה מבטיחה אחת היא השימוש בספריית הנתונים הלאומית (NDL) כדי לאפשר שיתוף נתונים בין-משרדי בין שירות הבריאות הלאומי (NHS) לבין משרד העבודה והפנסיה. על ידי קישור נתוני בריאות ותעסוקה, קובעי מדיניות יוכלו לקבל תובנות עמוקות יותר לגבי הקשרים בין תוצאות בריאותיות לגורמים סוציו-אקונומיים. בנוסף, שילוב אימות זכאות להטבות בתוך שירותי הבריאות יוכל להפחית הונאות ולהבטיח שמשאבים יוקצו לאלו הזקוקים לכך באמת.

יכולת פעולה הדדית חלקה בין מערכות ממשלתיות תהיה חיונית למקסום היתרונות של ספריית הנתונים הלאומית, לאפשר למשרדים לתקשר ביעילות ולהפחית את הצורך בעיבוד נתונים ידני.

אם תבנה אותה, הם יבואו

חזון הממשלה לספריית נתונים לאומית הוא שאפתני, אך הפוטנציאל שלה לשנות את השירותים הציבוריים הוא חסר תקדים. בעוד שהמבנה המדויק של ה-NDL טרם גובש סופית, המסע לקראת הקמתו חשוב לא פחות מהתוצאה.

.

להראות יותר

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

Back to top button

זוהה חוסם פרסומות

אנא שקול לתמוך בנו על ידי השבתת חוסם פרסומות שלך