مدل های داده برداری
هدف یادگیری
- هدف این بخش، درک چگونگی پیادهسازی مدلهای دادهبرداری در برنامههای GIS است.در مقابل مدل دادههای رستری، مدل دادههای برداری قرار دارد. در این مدل، فضا به سلولهای شبکهای مجزا تقسیم نمیشود، بلکه از نقاط و جفتهای مختصات X و Y برای نمایش رئوس ویژگیهای فضایی استفاده میشود، به گونهای که شبیه به ترسیم دستی روی نقشه است (آرونوف، ۱۹۸۹). سپس ویژگیهای دادهای این فضاها در یک سیستم مدیریت پایگاه داده جداگانه ذخیره میشوند. اطلاعات مکانی و عوارض در این مدلها از طریق یک شناسه ساده که به هر ویژگی در نقشه اختصاص داده میشود، به هم مرتبط میشوند.در سیستمهای اطلاعات جغرافیایی (GIS)، سه نوع اصلی داده برداری وجود دارد: نقاط، خطوط و چندضلعیها (شکل ۴٫۸: “نقاط، خطوط و چندضلعیها”).
- نقاط: اشیاء با ابعاد صفر که تنها یک جفت مختصات دارند. نقاط معمولاً برای مدلسازی عوارض مجزا و منفرد مانند ساختمانها، چاهها، تیرهای برق، مکانهای نمونه و غیره استفاده میشوند. نقاط فقط ویژگی مکان دارند.
- گره و رأس نیز انواع دیگر ویژگیهای نقطهای هستند. به طور خاص، یک نقطه یک ویژگی مستقل است، در حالی که یک گره یک اتصال توپولوژیکی است که یک جفت مختصات مشترک X، Y بین خطوط متقاطع و/یا چندضلعیها را نشان میدهد. رأس به عنوان هر خم در امتداد یک خط یا ویژگی چندضلعی که محل تلاقی خطوط یا چندضلعیها نیست، تعریف میشود.
این مدلها به GIS این امکان را میدهند که دادههای جغرافیایی را به شکلی دقیق و انعطافپذیر نمایش دهد و پردازشهای پیچیده را انجام دهد.
شکل ۴٫۸ نقاط، خطوط و چندضلعی ها
نقاط میتوانند بهطور فضایی به هم پیوند داده شوند تا ویژگیهای پیچیدهتری را تشکیل دهند. خطوط ویژگیهای یکبعدی هستند که از چندین نقطه بهطور صریح به هم متصل شدهاند. خطوط برای نمایش ویژگیهای خطی مانند جادهها، نهرها، گسلها، مرزها و غیره استفاده میشوند و دارای ویژگی طول هستند. خطوطی که بهطور مستقیم دو گره را به هم متصل میکنند، گاهی اوقات بهعنوان زنجیره، لبه، بخش یا قوس نامیده میشوند.
چندضلعیها ویژگیهای دوبعدی هستند که از چندین خط تشکیل میشوند و برای ایجاد یک ویژگی “بسته” به هم متصل میشوند. در چندضلعیها، اولین جفت مختصات (نقطه) در اولین پارهخط با آخرین جفت مختصات در آخرین پارهخط یکسان است. چندضلعیها برای نمایش ویژگیهایی مانند مرزهای شهرها، سازندهای زمینشناسی، دریاچهها، انجمنهای خاک، جوامع گیاهی و غیره بهکار میروند. این ویژگیها دارای خصوصیات مساحت و محیط هستند. به چندضلعیها معمولاً ناحیه نیز گفته میشود.
ساختارهای مدل های داده برداری
مدلهای داده برداری را میتوان به روشهای مختلفی ساختاردهی کرد. در اینجا، دو مورد از رایجترین ساختارهای داده را بررسی خواهیم کرد. سادهترین ساختار داده برداری، مدل داده اسپاگتی نامیده میشود (دانگرموند، ۱۹۸۲). در مدل اسپاگتی، هر نقطه، خط و/یا ویژگی چندضلعی به صورت رشتهای از جفت مختصات X و Y (یا بهطور خاص، یک جفت مختصات X و Y در مورد یک تصویر برداری با یک نقطه) نمایش داده میشود. این ساختار بهطور ذاتی بهگونهای است که میتوان هر خط را در این مدل بهعنوان یک رشته اسپاگتی تصور کرد که با افزودن رشتههای بیشتر، به اشکال پیچیده تبدیل میشود (شکل ۴٫۹: “مدل داده اسپاگتی”).
در این مدل، هنگامی که چند ضلعیها در مجاورت یکدیگر قرار میگیرند، هر کدام باید از خطوط خود یا همان “پایههای اسپاگتی” تشکیل شده باشند. به عبارت دیگر، هر چند ضلعی باید بهطور منحصربهفرد توسط مجموعهای از جفتهای مختصات X و Y تعریف شود، حتی اگر چند ضلعیهای مجاور دقیقا همان اطلاعات مرزی را به اشتراک بگذارند. این موضوع باعث ایجاد برخی افزونگیها در مدل داده میشود و در نتیجه کارایی آن را کاهش میدهد.
شکل ۴٫۹ مدل داده اسپاگتی
علیرغم تعیین مکانهای مرتبط با هر خط یا رشته اسپاگتی، روابط فضایی بهطور صریح در مدل اسپاگتی کدگذاری نشده است؛ بلکه این روابط با موقعیت مکانی آنها دلالت دارند. این موضوع منجر به کمبود اطلاعات توپولوژیکی میشود که میتواند در صورتی که کاربر بخواهد اندازهگیری یا تجزیه و تحلیل انجام دهد، مشکلاتی ایجاد کند. بنابراین، اگر هر تکنیک تحلیلی پیشرفتهای بر روی فایلهای برداری که به این شکل ساختار یافتهاند به کار گرفته شود، نیاز به محاسبات بسیار زیادی خواهد بود. با این حال، ساختار ساده مدل داده اسپاگتی این امکان را فراهم میآورد که نقشهها و گرافیکها بهطور کارآمد بازتولید شوند، چرا که این اطلاعات توپولوژیکی برای رسم و چاپ غیرضروری است.
برخلاف مدل داده اسپاگتی، مدل داده توپولوژیکی با گنجاندن اطلاعات توپولوژیکی در مجموعه داده مشخص میشود، همانطور که از نام آن پیداست. توپولوژی مجموعهای از قوانین است که روابط بین نقاط، خطوط و چندضلعیهای همسایه را مدل میکند و نحوه اشتراک هندسی آنها را تعیین مینماید. بهعنوان مثال، دو چندضلعی مجاور را در نظر بگیرید. در مدل اسپاگتی، مرز مشترک دو چندضلعی مجاور بهصورت دو خط مجزا و یکسان تعریف میشود. گنجاندن توپولوژی در مدل داده به یک خط این امکان را میدهد که مرز مشترک را با مرجع صریحی نشان دهد تا مشخص شود کدام سمت خط به کدام چندضلعی تعلق دارد. توپولوژی همچنین به حفظ ویژگیهای فضایی کمک میکند، بهویژه زمانی که اشکال خمیده، کشیده یا تحت تغییرات هندسی مشابه قرار میگیرند؛ این امر پیشبینی و بازپخش کارآمدتر فایلهای نقشه را امکانپذیر میسازد.
سه قانون اساسی توپولوژیکی که برای درک مدل دادههای توپولوژیکی ضروری است، در اینجا تشریح شده است. ابتدا، اتصال، توپولوژی گره قوس را برای مجموعه داده ویژگیها توصیف میکند. همانطور که قبلاً ذکر شد، گرهها تنها نقاط ساده نیستند. در مدل دادههای توپولوژیکی، گرهها نقاط تقاطعی هستند که در آن دو یا چند قوس به هم میرسند. در توپولوژی گره قوس، هر کمان دارای دو گره است: یک گره شروع که نشاندهنده نقطه شروع قوس و یک گره پایانی که نشاندهنده نقطه پایان آن است (شکل ۴٫۱۰: “توپولوژی گره قوس”). علاوه بر این، بین هر جفت گره یک پارهخط وجود دارد که گاهی اوقات به آن پیوند گفته میشود و شماره شناسایی خاص خود را دارد. این پیوند هم از گره و هم به گره مربوط به آن ارجاع داده میشود. در شکل ۴٫۱۰، کمانهای ۱، ۲ و ۳ با هم قطع میشوند چون گره ۱۱ را به اشتراک میگذارند. بنابراین، سیستم قادر است تعیین کند که میتوان در امتداد قوس ۱ حرکت کرده و به قوس ۳ چرخید، در حالی که امکان حرکت از قوس ۱ به قوس ۵ وجود ندارد، چرا که این دو قوس گره مشترک ندارند.
شکل ۴٫۱۰ توپولوژی گره قوس
دومین دستور توپولوژیکی اساسی، تعریف ناحیه است. این تعریف بیان میکند که کمانی که اطراف یک ناحیه را محاصره میکند، یک چندضلعی را تعریف میکند که به این توپولوژی چندضلعی-قوسی گفته میشود. در توپولوژی قوس-چندضلعی، از کمانها برای ساخت چندضلعیها استفاده میشود و هر کمان تنها یکبار ذخیره میشود (شکل ۴٫۱۱: “توپولوژی چندضلعی-قوس”). این روش باعث کاهش حجم دادههای ذخیرهشده میشود و تضمین میکند که مرزهای چندضلعیهای مجاور هیچگونه همپوشانی ندارند. در شکل ۴٫۱۱، توپولوژی چندضلعی-قوسی نشان میدهد که چندضلعی F از کمانهای ۸، ۹ و ۱۰ تشکیل شده است.
شکل ۴٫۱۱ توپولوژی Polygon-Arc
مجاورت، سومین دستور توپولوژیکی، بر اساس این مفهوم است که چندضلعیهایی که یک مرز مشترک دارند، مجاور تلقی میشوند. بهطور خاص، توپولوژی چندضلعی مستلزم این است که همه کمانها در یک چندضلعی یک جهت داشته باشند (یعنی یک گره از گره شروع و یک گره به گره پایان)، که این امر امکان تعیین اطلاعات مجاورت را فراهم میکند (شکل ۴٫۱۲: “توپولوژی چندضلعی”).
چندضلعیهایی که یک کمان مشترک دارند، مجاور یا به هم پیوسته در نظر گرفته میشوند و بنابراین میتوان ضلع “چپ” و “راست” هر کمان را تعریف کرد. این اطلاعات مربوط به چندضلعیهای چپ و راست بهطور صریح در اطلاعات ویژگی مدل داده توپولوژیکی ذخیره میشود.
“چندضلعی جهان” جزء ضروری توپولوژی چندضلعی است که ناحیه خارجی، واقع در خارج از منطقه مورد مطالعه، را نشان میدهد. شکل ۴٫۱۲: “توپولوژی چندضلعی” نشان میدهد که کمان ۶ در سمت چپ توسط چندضلعی B و در سمت راست توسط چندضلعی C محدود شده است.
شکل ۴٫۱۲ توپولوژی چند ضلعی
توپولوژی به رایانه این امکان را میدهد که به سرعت روابط فضایی میان تمام ویژگیهای موجود در دادهها را تعیین و تجزیهوتحلیل کند. علاوه بر این، اطلاعات توپولوژیکی اهمیت زیادی دارد، زیرا به شناسایی و اصلاح خطاهای موجود در یک مجموعه داده برداری بهطور کارآمد کمک میکند.
در ویژگیهای چندضلعی، خطاهایی مانند چندضلعیهای باز یا بستهنشده به وجود میآید، زمانی که یک قوس بهطور کامل به خودش حلقه نمیزند، یا چندضلعیهای بدون برچسب، که زمانی رخ میدهند که ناحیهای فاقد اطلاعات ویژگی است. این موارد قوانین توپولوژی قوسچندضلعی را نقض میکنند. یکی دیگر از خطاهای رایج در ویژگیهای چندضلعی، sliver است که زمانی ایجاد میشود که مرز مشترک دو چندضلعی دقیقاً به هم نمیرسد (شکل ۴٫۱۳: “خطاهای توپولوژیکی رایج”).
در ویژگیهای خطی، خطاهای توپولوژیکی زمانی به وجود میآیند که دو خط بهطور کامل در یک گره به هم نرسند. این خطا هنگامی رخ میدهد که خطوط به اندازه کافی گسترش نیافتهاند تا به یکدیگر برسند یا زمانی که یک خط فراتر از ویژگیای که باید به آن متصل شود، گسترش یابد و به اصطلاح “بیش از حد” میشود (شکل ۴٫۱۳: “خطاهای توپولوژیکی رایج”). این خطاها به شکل یک “گره آویزان” در انتهای خط ظاهر میشوند.
گرههای آویزان همیشه خطا نیستند، زیرا در مواردی مانند خیابانهای بنبست در نقشههای راه، بهطور طبیعی دیده میشوند.
شکل ۴٫۱۳ خطاهای توپولوژیکی رایج
بسیاری از انواع تحلیلهای فضایی به سازماندهی دقیق و مشخصی که مدلهای داده توپولوژیکی ارائه میدهند، نیاز دارند. بهویژه، تحلیل شبکه (مانند یافتن بهترین مسیر از یک مکان به مکان دیگر) و تحلیل اندازهگیری (مثل تعیین طول یک بخش از رودخانه) به شدت به مفهوم گرههای to و from وابسته هستند. این اطلاعات، همراه با ویژگیهای فضایی، برای محاسبه مسافتها، کوتاهترین مسیرها، سریعترین مسیرها و سایر تحلیلها مورد استفاده قرار میگیرند. علاوه بر این، توپولوژی امکان انجام تحلیلهای پیچیده همسایگی مانند تعیین مجاورت، خوشهبندی، نزدیکترین همسایگان و دیگر تحلیلها را فراهم میکند.
اکنون که اصول پایهای مفاهیم توپولوژی روشن شد، میتوانیم مدل دادههای توپولوژیکی را بهتر درک کنیم. در این مدل، گرهها فراتر از یک نقطه ساده در امتداد یک خط یا چند ضلعی عمل میکنند. گرهها نمایانگر نقطه تقاطع دو یا چند قوس هستند. کمانها ممکن است در یک چند ضلعی حلقه شوند یا خیر. در هر صورت، تمامی گرهها، کمانها و چندضلعیها به صورت مجزا شمارهگذاری میشوند. این شمارهگذاری، امکان ارجاع سریع و ساده به هر عنصر را در مدل داده فراهم میآورد.
مزایا/معایب مدل برداری
در مقایسه با مدل دادههای رستری، مدلهای داده برداری به دلیل دقت بالای نقاط، خطوط و چندضلعیها نسبت به سلولهای شبکه با فاصله منظم در مدل رستری، نمایش بهتری از واقعیت دارند. این ویژگی منجر به دادههای برداری میشود که از نظر زیباییشناختی نیز دلپذیرتر از دادههای رستری هستند.
دادههای برداری همچنین امکان تغییر مقیاس دقیقتر برای مشاهده و تجزیه و تحلیل را فراهم میکنند. زیرا هر جفت مختصات مرتبط با یک نقطه، خط یا چندضلعی، یک مکان دقیق و بینهایت دقیق را نشان میدهد (البته این دقت به تعداد ارقام معنادار و یا روشهای اکتساب داده محدود است). بنابراین، بزرگنمایی عمیق در یک تصویر برداری، نمای گرافیک برداری را تغییر نمیدهد، برخلاف گرافیک رستری که با بزرگنمایی، پیکسلها بیشتر نمایان میشوند (شکل ۴٫۱ “تصویر دیجیتالی با بزرگنمایی و نمایش پیکسل شدن تصویر رستری” را ببینید).
دادههای برداری از نظر ساختار داده فشردهتر هستند، بنابراین اندازه فایلها معمولاً بسیار کوچکتر از همتایان رستری خود است. هرچند که قدرت پردازش کامپیوترهای مدرن باعث کاهش اهمیت حفظ اندازه فایلهای کوچک شده است، با این حال دادههای برداری معمولاً به کسری از فضای ذخیرهسازی دادههای شطرنجی نیاز دارند.
مزیت نهایی دادههای برداری این است که توپولوژی در مدل برداری به طور ذاتی گنجانده شده است. این اطلاعات توپولوژیکی، منجر به تجزیه و تحلیل فضایی سادهتری میشود (برای مثال، شناسایی خطاها، تجزیه و تحلیل شبکه، تحلیل مجاورت و تبدیل فضایی) هنگام استفاده از مدلهای برداری.
با این حال، مدل داده برداری دو نقطه ضعف اصلی دارد. اولاً، ساختار دادهها در این مدل نسبت به مدلهای شطرنجی پیچیدهتر است. از آنجا که مکان هر رأس باید به طور صریح در مدل ذخیره شود، هیچ میانبری برای ذخیرهسازی دادهها مانند مدلهای رستری وجود ندارد (مانند روشهای رمزگذاری طول اجرا و چهار درخت).
دوم، انجام تحلیلهای فضایی میتواند به دلیل تفاوتهای جزئی در دقت و صحت دادههای ورودی، نسبتاً پیچیده باشد. همچنین، الگوریتمهای دستکاری و تحلیل دادههای برداری پیچیده هستند و ممکن است نیاز به منابع پردازشی زیادی داشته باشند، بهویژه زمانی که با مجموعه دادههای بزرگ سر و کار داریم.
خوراکی های کلیدی
- داده های برداری از نقاط، خطوط و چندضلعی ها برای نمایش ویژگی های فضایی در نقشه استفاده می کنند.
- توپولوژی یک ویژگی جغرافیایی اطلاعاتی است که اتصال، تعریف ناحیه، و مجاورت نقاط، خطوط و چندضلعی مرتبط با هم را توصیف می کند.
- بسته به ساختار داده فایل، داده های برداری ممکن است از نظر توپولوژیکی صریح باشند یا نباشند.
- باید دقت کرد که آیا مدل دادههای رستری یا برداری برای دادهها و/یا نیازهای تحلیلی شما مناسبتر است یا خیر.
تمرینات
- کدام نوع برداری (نقطه، خط یا چند ضلعی) ویژگی های زیر را به بهترین شکل نشان می دهد: مرزهای ایالت، قطب های تلفن، ساختمان ها، شهرها، شبکه های جریان، قله های کوه، انواع خاک، مسیرهای پرواز؟کدام یک از این ویژگی ها را می توان با چندین نوع برداری نشان داد؟ چه شرایطی ممکن است باعث شود یک نوع برداری را بر دیگری انتخاب کنید؟
- بر روی یک سیستم مختصات دکارتی یک ویژگی نقطه، خط و چندضلعی رسم کنید. از این نقاشی، یک مدل داده اسپاگتی ایجاد کنید که به شکل های نشان داده شده در آن تقریبی دارد.
- سه چند ضلعی مجاور را بر روی یک سیستم مختصات دکارتی ساده رسم کنید. از این نقشه، یک مدل داده توپولوژیکی ایجاد کنید که توپولوژی گره قوس، چندضلعی-قوس و چندضلعی را در خود جای دهد.