ملزومات سیستم های اطلاعات جغرافیایی (مدل های داده برداری)


مدل های داده برداری

هدف یادگیری

  1. هدف این بخش، درک چگونگی پیاده‌سازی مدل‌های داده‌برداری در برنامه‌های GIS است.در مقابل مدل داده‌های رستری، مدل داده‌های برداری قرار دارد. در این مدل، فضا به سلول‌های شبکه‌ای مجزا تقسیم نمی‌شود، بلکه از نقاط و جفت‌های مختصات X و Y برای نمایش رئوس ویژگی‌های فضایی استفاده می‌شود، به گونه‌ای که شبیه به ترسیم دستی روی نقشه است (آرونوف، ۱۹۸۹). سپس ویژگی‌های داده‌ای این فضاها در یک سیستم مدیریت پایگاه داده جداگانه ذخیره می‌شوند. اطلاعات مکانی و عوارض در این مدل‌ها از طریق یک شناسه ساده که به هر ویژگی در نقشه اختصاص داده می‌شود، به هم مرتبط می‌شوند.در سیستم‌های اطلاعات جغرافیایی (GIS)، سه نوع اصلی داده برداری وجود دارد: نقاط، خطوط و چندضلعی‌ها (شکل ۴٫۸: “نقاط، خطوط و چندضلعی‌ها”).
    • نقاط: اشیاء با ابعاد صفر که تنها یک جفت مختصات دارند. نقاط معمولاً برای مدل‌سازی عوارض مجزا و منفرد مانند ساختمان‌ها، چاه‌ها، تیرهای برق، مکان‌های نمونه و غیره استفاده می‌شوند. نقاط فقط ویژگی مکان دارند.
    • گره و رأس نیز انواع دیگر ویژگی‌های نقطه‌ای هستند. به طور خاص، یک نقطه یک ویژگی مستقل است، در حالی که یک گره یک اتصال توپولوژیکی است که یک جفت مختصات مشترک X، Y بین خطوط متقاطع و/یا چندضلعی‌ها را نشان می‌دهد. رأس به عنوان هر خم در امتداد یک خط یا ویژگی چندضلعی که محل تلاقی خطوط یا چندضلعی‌ها نیست، تعریف می‌شود.

    این مدل‌ها به GIS این امکان را می‌دهند که داده‌های جغرافیایی را به شکلی دقیق و انعطاف‌پذیر نمایش دهد و پردازش‌های پیچیده را انجام دهد.

شکل ۴٫۸ نقاط، خطوط و چندضلعی ها

نقاط می‌توانند به‌طور فضایی به هم پیوند داده شوند تا ویژگی‌های پیچیده‌تری را تشکیل دهند. خطوط ویژگی‌های یک‌بعدی هستند که از چندین نقطه به‌طور صریح به هم متصل شده‌اند. خطوط برای نمایش ویژگی‌های خطی مانند جاده‌ها، نهرها، گسل‌ها، مرزها و غیره استفاده می‌شوند و دارای ویژگی طول هستند. خطوطی که به‌طور مستقیم دو گره را به هم متصل می‌کنند، گاهی اوقات به‌عنوان زنجیره، لبه، بخش یا قوس نامیده می‌شوند.

چندضلعی‌ها ویژگی‌های دوبعدی هستند که از چندین خط تشکیل می‌شوند و برای ایجاد یک ویژگی “بسته” به هم متصل می‌شوند. در چندضلعی‌ها، اولین جفت مختصات (نقطه) در اولین پاره‌خط با آخرین جفت مختصات در آخرین پاره‌خط یکسان است. چندضلعی‌ها برای نمایش ویژگی‌هایی مانند مرزهای شهرها، سازندهای زمین‌شناسی، دریاچه‌ها، انجمن‌های خاک، جوامع گیاهی و غیره به‌کار می‌روند. این ویژگی‌ها دارای خصوصیات مساحت و محیط هستند. به چندضلعی‌ها معمولاً ناحیه نیز گفته می‌شود.

ساختارهای مدل های داده برداری

مدل‌های داده برداری را می‌توان به روش‌های مختلفی ساختاردهی کرد. در اینجا، دو مورد از رایج‌ترین ساختارهای داده را بررسی خواهیم کرد. ساده‌ترین ساختار داده برداری، مدل داده اسپاگتی نامیده می‌شود (دانگرموند، ۱۹۸۲). در مدل اسپاگتی، هر نقطه، خط و/یا ویژگی چندضلعی به صورت رشته‌ای از جفت مختصات X و Y (یا به‌طور خاص، یک جفت مختصات X و Y در مورد یک تصویر برداری با یک نقطه) نمایش داده می‌شود. این ساختار به‌طور ذاتی به‌گونه‌ای است که می‌توان هر خط را در این مدل به‌عنوان یک رشته اسپاگتی تصور کرد که با افزودن رشته‌های بیشتر، به اشکال پیچیده تبدیل می‌شود (شکل ۴٫۹: “مدل داده اسپاگتی”).

در این مدل، هنگامی که چند ضلعی‌ها در مجاورت یکدیگر قرار می‌گیرند، هر کدام باید از خطوط خود یا همان “پایه‌های اسپاگتی” تشکیل شده باشند. به عبارت دیگر، هر چند ضلعی باید به‌طور منحصربه‌فرد توسط مجموعه‌ای از جفت‌های مختصات X و Y تعریف شود، حتی اگر چند ضلعی‌های مجاور دقیقا همان اطلاعات مرزی را به اشتراک بگذارند. این موضوع باعث ایجاد برخی افزونگی‌ها در مدل داده می‌شود و در نتیجه کارایی آن را کاهش می‌دهد.

شکل ۴٫۹ مدل داده اسپاگتی

علیرغم تعیین مکان‌های مرتبط با هر خط یا رشته اسپاگتی، روابط فضایی به‌طور صریح در مدل اسپاگتی کدگذاری نشده است؛ بلکه این روابط با موقعیت مکانی آن‌ها دلالت دارند. این موضوع منجر به کمبود اطلاعات توپولوژیکی می‌شود که می‌تواند در صورتی که کاربر بخواهد اندازه‌گیری یا تجزیه و تحلیل انجام دهد، مشکلاتی ایجاد کند. بنابراین، اگر هر تکنیک تحلیلی پیشرفته‌ای بر روی فایل‌های برداری که به این شکل ساختار یافته‌اند به کار گرفته شود، نیاز به محاسبات بسیار زیادی خواهد بود. با این حال، ساختار ساده مدل داده اسپاگتی این امکان را فراهم می‌آورد که نقشه‌ها و گرافیک‌ها به‌طور کارآمد بازتولید شوند، چرا که این اطلاعات توپولوژیکی برای رسم و چاپ غیرضروری است.

برخلاف مدل داده اسپاگتی، مدل داده توپولوژیکی با گنجاندن اطلاعات توپولوژیکی در مجموعه داده مشخص می‌شود، همانطور که از نام آن پیداست. توپولوژی مجموعه‌ای از قوانین است که روابط بین نقاط، خطوط و چندضلعی‌های همسایه را مدل می‌کند و نحوه اشتراک هندسی آن‌ها را تعیین می‌نماید. به‌عنوان مثال، دو چندضلعی مجاور را در نظر بگیرید. در مدل اسپاگتی، مرز مشترک دو چندضلعی مجاور به‌صورت دو خط مجزا و یکسان تعریف می‌شود. گنجاندن توپولوژی در مدل داده به یک خط این امکان را می‌دهد که مرز مشترک را با مرجع صریحی نشان دهد تا مشخص شود کدام سمت خط به کدام چندضلعی تعلق دارد. توپولوژی همچنین به حفظ ویژگی‌های فضایی کمک می‌کند، به‌ویژه زمانی که اشکال خمیده، کشیده یا تحت تغییرات هندسی مشابه قرار می‌گیرند؛ این امر پیش‌بینی و بازپخش کارآمدتر فایل‌های نقشه را امکان‌پذیر می‌سازد.

سه قانون اساسی توپولوژیکی که برای درک مدل داده‌های توپولوژیکی ضروری است، در اینجا تشریح شده است. ابتدا، اتصال، توپولوژی گره قوس را برای مجموعه داده ویژگی‌ها توصیف می‌کند. همانطور که قبلاً ذکر شد، گره‌ها تنها نقاط ساده نیستند. در مدل داده‌های توپولوژیکی، گره‌ها نقاط تقاطعی هستند که در آن دو یا چند قوس به هم می‌رسند. در توپولوژی گره قوس، هر کمان دارای دو گره است: یک گره شروع که نشان‌دهنده نقطه شروع قوس و یک گره پایانی که نشان‌دهنده نقطه پایان آن است (شکل ۴٫۱۰: “توپولوژی گره قوس”). علاوه بر این، بین هر جفت گره یک پاره‌خط وجود دارد که گاهی اوقات به آن پیوند گفته می‌شود و شماره شناسایی خاص خود را دارد. این پیوند هم از گره و هم به گره مربوط به آن ارجاع داده می‌شود. در شکل ۴٫۱۰، کمان‌های ۱، ۲ و ۳ با هم قطع می‌شوند چون گره ۱۱ را به اشتراک می‌گذارند. بنابراین، سیستم قادر است تعیین کند که می‌توان در امتداد قوس ۱ حرکت کرده و به قوس ۳ چرخید، در حالی که امکان حرکت از قوس ۱ به قوس ۵ وجود ندارد، چرا که این دو قوس گره مشترک ندارند.

شکل ۴٫۱۰ توپولوژی گره قوس

دومین دستور توپولوژیکی اساسی، تعریف ناحیه است. این تعریف بیان می‌کند که کمانی که اطراف یک ناحیه را محاصره می‌کند، یک چندضلعی را تعریف می‌کند که به این توپولوژی چندضلعی-قوسی گفته می‌شود. در توپولوژی قوس-چندضلعی، از کمان‌ها برای ساخت چندضلعی‌ها استفاده می‌شود و هر کمان تنها یک‌بار ذخیره می‌شود (شکل ۴٫۱۱: “توپولوژی چندضلعی-قوس”). این روش باعث کاهش حجم داده‌های ذخیره‌شده می‌شود و تضمین می‌کند که مرزهای چندضلعی‌های مجاور هیچ‌گونه همپوشانی ندارند. در شکل ۴٫۱۱، توپولوژی چندضلعی-قوسی نشان می‌دهد که چندضلعی F از کمان‌های ۸، ۹ و ۱۰ تشکیل شده است.

شکل ۴٫۱۱ توپولوژی Polygon-Arc

مجاورت، سومین دستور توپولوژیکی، بر اساس این مفهوم است که چندضلعی‌هایی که یک مرز مشترک دارند، مجاور تلقی می‌شوند. به‌طور خاص، توپولوژی چندضلعی مستلزم این است که همه کمان‌ها در یک چندضلعی یک جهت داشته باشند (یعنی یک گره از گره شروع و یک گره به گره پایان)، که این امر امکان تعیین اطلاعات مجاورت را فراهم می‌کند (شکل ۴٫۱۲: “توپولوژی چندضلعی”).

چندضلعی‌هایی که یک کمان مشترک دارند، مجاور یا به هم پیوسته در نظر گرفته می‌شوند و بنابراین می‌توان ضلع “چپ” و “راست” هر کمان را تعریف کرد. این اطلاعات مربوط به چندضلعی‌های چپ و راست به‌طور صریح در اطلاعات ویژگی مدل داده توپولوژیکی ذخیره می‌شود.

“چندضلعی جهان” جزء ضروری توپولوژی چندضلعی است که ناحیه خارجی، واقع در خارج از منطقه مورد مطالعه، را نشان می‌دهد. شکل ۴٫۱۲: “توپولوژی چندضلعی” نشان می‌دهد که کمان ۶ در سمت چپ توسط چندضلعی B و در سمت راست توسط چندضلعی C محدود شده است.

شکل ۴٫۱۲ توپولوژی چند ضلعی

توپولوژی به رایانه این امکان را می‌دهد که به سرعت روابط فضایی میان تمام ویژگی‌های موجود در داده‌ها را تعیین و تجزیه‌وتحلیل کند. علاوه بر این، اطلاعات توپولوژیکی اهمیت زیادی دارد، زیرا به شناسایی و اصلاح خطاهای موجود در یک مجموعه داده برداری به‌طور کارآمد کمک می‌کند.

در ویژگی‌های چندضلعی، خطاهایی مانند چندضلعی‌های باز یا بسته‌نشده به وجود می‌آید، زمانی که یک قوس به‌طور کامل به خودش حلقه نمی‌زند، یا چندضلعی‌های بدون برچسب، که زمانی رخ می‌دهند که ناحیه‌ای فاقد اطلاعات ویژگی است. این موارد قوانین توپولوژی قوس‌چندضلعی را نقض می‌کنند. یکی دیگر از خطاهای رایج در ویژگی‌های چندضلعی، sliver است که زمانی ایجاد می‌شود که مرز مشترک دو چندضلعی دقیقاً به هم نمی‌رسد (شکل ۴٫۱۳: “خطاهای توپولوژیکی رایج”).

در ویژگی‌های خطی، خطاهای توپولوژیکی زمانی به وجود می‌آیند که دو خط به‌طور کامل در یک گره به هم نرسند. این خطا هنگامی رخ می‌دهد که خطوط به اندازه کافی گسترش نیافته‌اند تا به یکدیگر برسند یا زمانی که یک خط فراتر از ویژگی‌ای که باید به آن متصل شود، گسترش یابد و به اصطلاح “بیش از حد” می‌شود (شکل ۴٫۱۳: “خطاهای توپولوژیکی رایج”). این خطاها به شکل یک “گره آویزان” در انتهای خط ظاهر می‌شوند.

گره‌های آویزان همیشه خطا نیستند، زیرا در مواردی مانند خیابان‌های بن‌بست در نقشه‌های راه، به‌طور طبیعی دیده می‌شوند.

شکل ۴٫۱۳ خطاهای توپولوژیکی رایج

بسیاری از انواع تحلیل‌های فضایی به سازماندهی دقیق و مشخصی که مدل‌های داده توپولوژیکی ارائه می‌دهند، نیاز دارند. به‌ویژه، تحلیل شبکه (مانند یافتن بهترین مسیر از یک مکان به مکان دیگر) و تحلیل اندازه‌گیری (مثل تعیین طول یک بخش از رودخانه) به شدت به مفهوم گره‌های to و from وابسته هستند. این اطلاعات، همراه با ویژگی‌های فضایی، برای محاسبه مسافت‌ها، کوتاه‌ترین مسیرها، سریع‌ترین مسیرها و سایر تحلیل‌ها مورد استفاده قرار می‌گیرند. علاوه بر این، توپولوژی امکان انجام تحلیل‌های پیچیده همسایگی مانند تعیین مجاورت، خوشه‌بندی، نزدیک‌ترین همسایگان و دیگر تحلیل‌ها را فراهم می‌کند.

اکنون که اصول پایه‌ای مفاهیم توپولوژی روشن شد، می‌توانیم مدل داده‌های توپولوژیکی را بهتر درک کنیم. در این مدل، گره‌ها فراتر از یک نقطه ساده در امتداد یک خط یا چند ضلعی عمل می‌کنند. گره‌ها نمایانگر نقطه تقاطع دو یا چند قوس هستند. کمان‌ها ممکن است در یک چند ضلعی حلقه شوند یا خیر. در هر صورت، تمامی گره‌ها، کمان‌ها و چندضلعی‌ها به صورت مجزا شماره‌گذاری می‌شوند. این شماره‌گذاری، امکان ارجاع سریع و ساده به هر عنصر را در مدل داده فراهم می‌آورد.

مزایا/معایب مدل برداری

در مقایسه با مدل داده‌های رستری، مدل‌های داده برداری به دلیل دقت بالای نقاط، خطوط و چندضلعی‌ها نسبت به سلول‌های شبکه با فاصله منظم در مدل رستری، نمایش بهتری از واقعیت دارند. این ویژگی منجر به داده‌های برداری می‌شود که از نظر زیبایی‌شناختی نیز دلپذیرتر از داده‌های رستری هستند.

داده‌های برداری همچنین امکان تغییر مقیاس دقیق‌تر برای مشاهده و تجزیه و تحلیل را فراهم می‌کنند. زیرا هر جفت مختصات مرتبط با یک نقطه، خط یا چندضلعی، یک مکان دقیق و بی‌نهایت دقیق را نشان می‌دهد (البته این دقت به تعداد ارقام معنادار و یا روش‌های اکتساب داده محدود است). بنابراین، بزرگ‌نمایی عمیق در یک تصویر برداری، نمای گرافیک برداری را تغییر نمی‌دهد، برخلاف گرافیک رستری که با بزرگ‌نمایی، پیکسل‌ها بیشتر نمایان می‌شوند (شکل ۴٫۱ “تصویر دیجیتالی با بزرگنمایی و نمایش پیکسل شدن تصویر رستری” را ببینید).

داده‌های برداری از نظر ساختار داده فشرده‌تر هستند، بنابراین اندازه فایل‌ها معمولاً بسیار کوچک‌تر از همتایان رستری خود است. هرچند که قدرت پردازش کامپیوترهای مدرن باعث کاهش اهمیت حفظ اندازه فایل‌های کوچک شده است، با این حال داده‌های برداری معمولاً به کسری از فضای ذخیره‌سازی داده‌های شطرنجی نیاز دارند.

مزیت نهایی داده‌های برداری این است که توپولوژی در مدل برداری به طور ذاتی گنجانده شده است. این اطلاعات توپولوژیکی، منجر به تجزیه و تحلیل فضایی ساده‌تری می‌شود (برای مثال، شناسایی خطاها، تجزیه و تحلیل شبکه، تحلیل مجاورت و تبدیل فضایی) هنگام استفاده از مدل‌های برداری.

با این حال، مدل داده برداری دو نقطه ضعف اصلی دارد. اولاً، ساختار داده‌ها در این مدل نسبت به مدل‌های شطرنجی پیچیده‌تر است. از آنجا که مکان هر رأس باید به طور صریح در مدل ذخیره شود، هیچ میانبری برای ذخیره‌سازی داده‌ها مانند مدل‌های رستری وجود ندارد (مانند روش‌های رمزگذاری طول اجرا و چهار درخت).

دوم، انجام تحلیل‌های فضایی می‌تواند به دلیل تفاوت‌های جزئی در دقت و صحت داده‌های ورودی، نسبتاً پیچیده باشد. همچنین، الگوریتم‌های دستکاری و تحلیل داده‌های برداری پیچیده هستند و ممکن است نیاز به منابع پردازشی زیادی داشته باشند، به‌ویژه زمانی که با مجموعه داده‌های بزرگ سر و کار داریم.

خوراکی های کلیدی

  • داده های برداری از نقاط، خطوط و چندضلعی ها برای نمایش ویژگی های فضایی در نقشه استفاده می کنند.
  • توپولوژی یک ویژگی جغرافیایی اطلاعاتی است که اتصال، تعریف ناحیه، و مجاورت نقاط، خطوط و چندضلعی مرتبط با هم را توصیف می کند.
  • بسته به ساختار داده فایل، داده های برداری ممکن است از نظر توپولوژیکی صریح باشند یا نباشند.
  • باید دقت کرد که آیا مدل داده‌های رستری یا برداری برای داده‌ها و/یا نیازهای تحلیلی شما مناسب‌تر است یا خیر.

تمرینات

  1. کدام نوع برداری (نقطه، خط یا چند ضلعی) ویژگی های زیر را به بهترین شکل نشان می دهد: مرزهای ایالت، قطب های تلفن، ساختمان ها، شهرها، شبکه های جریان، قله های کوه، انواع خاک، مسیرهای پرواز؟کدام یک از این ویژگی ها را می توان با چندین نوع برداری نشان داد؟ چه شرایطی ممکن است باعث شود یک نوع برداری را بر دیگری انتخاب کنید؟
  2. بر روی یک سیستم مختصات دکارتی یک ویژگی نقطه، خط و چندضلعی رسم کنید. از این نقاشی، یک مدل داده اسپاگتی ایجاد کنید که به شکل های نشان داده شده در آن تقریبی دارد.
  3. سه چند ضلعی مجاور را بر روی یک سیستم مختصات دکارتی ساده رسم کنید. از این نقشه، یک مدل داده توپولوژیکی ایجاد کنید که توپولوژی گره قوس، چندضلعی-قوس و چندضلعی را در خود جای دهد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

خانهدربارهتماسارتباط با ما