ملزومات سیستم های اطلاعات جغرافیایی(فرمت های فایل)


 فرمت های فایل

هدف یادگیری

هدف این محتوا، بررسی اجمالی نمونه‌ای از رایج‌ترین انواع فرمت‌های فایل‌های برداری، رستری و ترکیبی است.داده‌های مکانی در فرمت‌های مختلف فایل ذخیره می‌شوند و هر بسته نرم‌افزاری سیستم اطلاعات جغرافیایی (GIS) و هر نسخه از این بسته‌ها، فرمت‌های خاص خود را پشتیبانی می‌کند. این موضوع برای داده‌های برداری و رستری صدق می‌کند. اگرچه در اینجا چند فرمت فایل رایج خلاصه شده است، اما فرمت‌های بسیاری نیز برای استفاده در برنامه‌های مختلف GIS وجود دارند.

فرمت های فایل برداری

رایج‌ترین فرمت فایل برای داده‌های برداری، Shapefile است. این فرمت که توسط ESRI در اوایل دهه ۱۹۹۰ برای استفاده در بسته نرم‌افزاری مدیریت پایگاه داده dBASE III در ArcView 2 توسعه یافت، فایل‌هایی ساده و غیرتوپولوژیکی است که برای ذخیره‌سازی موقعیت هندسی و اطلاعات عوارض جغرافیایی طراحی شده‌اند. Shapefile قادر به ذخیره مقادیر null و همچنین حاشیه‌نویسی یا ویژگی‌های شبکه نیست. علاوه بر این، نام فیلدها در جدول ویژگی‌ها به ده کاراکتر محدود می‌شود و هر shapefile می‌تواند تنها ویژگی‌های نقطه‌ای، خطی یا چندضلعی را نمایندگی کند. انواع داده‌های پشتیبانی‌شده شامل ممیز شناور، عدد صحیح، تاریخ و متن هستند. این فرمت تقریباً توسط تمام نرم‌افزارهای تجاری و متن‌باز GIS پشتیبانی می‌شود.

با وجود این که این فرمت به عنوان “شیپ فایل” شناخته می‌شود، در واقع مجموعه‌ای از فایل‌های مختلف است. جدول ۵٫۱ “انواع فایل Shapefile”، فرمت‌های مختلف فایل مرتبط با shapefile را فهرست کرده و توضیح می‌دهد. در میان این فرمت‌ها، تنها فایل‌های SHP، SHX و DBF برای ایجاد یک shapefile الزامی هستند، در حالی که دیگر فرمت‌ها اختیاری و مشروط به استفاده هستند. به عنوان یک قاعده کلی، هنگام استفاده از نسخه‌های قدیمی بسته‌های نرم‌افزاری GIS، نام هر فایل باید مطابق با قرارداد MS-DOS 8.3 باشد. طبق این قرارداد، پیشوند نام فایل می‌تواند حداکثر ۸ کاراکتر و پسوند آن باید سه کاراکتر باشد. بسته‌های نرم‌افزاری جدیدتر GIS این محدودیت را کاهش داده و پیشوندهای طولانی‌تری را می‌پذیرند.

جدول ۵٫۱ انواع فایل Shapefile

فرمت فایل هدف
SHP* هندسه ویژگی
SHX* قالب شاخص برای هندسه ویژگی
DBF* اطلاعات ویژگی ها را در قالب dBASE IV مشخص کنید
PRJ اطلاعات پروجکشن
SBN و SBX شاخص فضایی ویژگی ها
FBN و FBX شاخص فضایی فقط خواندنی ویژگی ها
AIN و AIH اطلاعات مربوط به فیلدهای فعال در جدول را مشخص کنید
IXS فهرست ژئوکدینگ برای شکل فایل‌های خواندن و نوشتن
MXS ایندکس ژئوکدینگ برای فایل های شکلی خواندن و نوشتن با فرمت ODB
ATX شاخص مشخصه مورد استفاده در ArcGIS 8 به بعد
SHP.XML متادیتا در قالب XML
CPG مشخصات صفحه کد برای شناسایی رمزگذاری کاراکترها
* فایل های اجباری را نشان می دهد

 

اولین فرمت فایل برداری برای استفاده در بسته‌های نرم‌افزاری GIS که هنوز هم مورد استفاده قرار می‌گیرد، پوشش ArcInfo است. این فرمت فایل جغرافیایی از انواع مختلف ویژگی‌ها (مانند نقاط، خطوط، چندضلعی‌ها، annotations) پشتیبانی می‌کند و در عین حال اطلاعات توپولوژیکی مرتبط با آن ویژگی‌ها را نیز ذخیره می‌کند. داده‌های عوارض به‌صورت فایل‌های متعدد در یک فهرست جداگانه به نام “اطلاعات” ذخیره می‌شوند. به دلیل توسعه آن در محیط MS-DOS، این فایل‌ها محدودیت‌های نام‌گذاری خاصی دارند. به‌طور مثال، نام فایل‌ها نمی‌توانند بیشتر از ۱۳ کاراکتر باشند، نباید حاوی فاصله باشند، نمی‌توانند با عدد شروع شوند و باید تماماً به حروف کوچک نوشته شوند. پوشش‌ها را نمی‌توان در نسخه‌های ArcGIS 9.x یا نسخه‌های جدیدتر بسته نرم‌افزاری ESRI ویرایش کرد.

اداره سرشماری ایالات متحده نوع خاصی از shapefile به نام TIGER یا TIGER/Line (سیستم رمزگذاری و ارجاع جغرافیایی یکپارچه توپولوژیکی) نگهداری می‌کند. اگرچه این فایل‌های متن‌باز حاوی اطلاعات واقعی سرشماری نیستند، اما ویژگی‌هایی مانند مسیرهای سرشماری، جاده‌ها، راه‌آهن‌ها، ساختمان‌ها، رودخانه‌ها و سایر عوارض را ترسیم می‌کنند که از اداره پشتیبانی و بهبود می‌یابند و توانایی اداره برای جمع‌آوری اطلاعات سرشماری را افزایش می‌دهند. فایل‌های TIGER/Line که برای اولین بار در سال ۱۹۹۰ منتشر شدند، از نظر توپولوژیکی دقیق هستند و با فایل آدرس اصلی اداره سرشماری (MAF) مرتبط می‌باشند، به این ترتیب امکان کدگذاری جغرافیایی آدرس‌های خیابانی را فراهم می‌کنند. این فایل‌ها برای عموم رایگان بوده و می‌توانند به‌طور رایگان از فروشندگان خصوصی که این فرمت را پشتیبانی می‌کنند، دانلود شوند.

اتوکد DXF (فرمت تبادل نقشه) یک فرمت فایل برداری اختصاصی است که توسط Autodesk ایجاد شده تا امکان تبادل بین نرم‌افزار CAD مبتنی بر طراحی به کمک کامپیوتر (CAD) و سایر بسته‌های نرم‌افزاری نقشه‌برداری را فراهم کند. فایل‌های DXF برای اولین بار در سال ۱۹۸۲ با هدف ارائه نمایش دقیق فرمت بومی DWG اتوکد منتشر شدند. اگرچه DXF هنوز هم به‌طور گسترده استفاده می‌شود، نسخه‌های جدیدتر اتوکد انواع داده‌های پیچیده‌تری مانند مناطق و بلوک‌های پویا را در خود جای داده‌اند که در قالب DXF پشتیبانی نمی‌شوند. بنابراین، این فرمت ممکن است در تحلیل‌های مکانی به‌مرور زمان کمتر محبوب شود.

در نهایت، سازمان زمین‌شناسی ایالات متحده (USGS) یک فرمت فایل برداری متن‌باز را حفظ می‌کند که اطلاعات فیزیکی و فرهنگی را در سراسر ایالات متحده نمایان می‌سازد. این فایل‌ها که به‌عنوان DLG (گرافیک خط رقومی) شناخته می‌شوند، بسته به مقیاس نقشه‌برداری، به سه دسته بزرگ، متوسط و کوچک تقسیم می‌شوند: ۱:۲۴۰۰۰، ۱:۱۰۰۰۰۰ و ۱:۲۰۰۰۰۰۰٫ ویژگی‌های موجود در انواع مختلف DLG بستگی به مقیاس آن دارند، اما به‌طور کلی شامل داده‌هایی مانند مرزهای اداری و سیاسی، هیدروگرافی، سیستم‌های حمل و نقل، هیپوگرافی و پوشش زمین است.

فایل‌های داده برداری همچنین می‌توانند برای نمایش اطلاعات ارتفاع سطح ساختاری استفاده شوند. TIN (شبکه نامنظم مثلثی) یک ساختار داده برداری متن‌باز است که از مثلث‌های به هم پیوسته و غیرهمپوشانی برای نمایش سطوح جغرافیایی استفاده می‌کند. در حالی که تصویر رستری ارتفاع را به‌صورت میانگین در هر پیکسل نشان می‌دهد (برای اطلاعات بیشتر به پست “فرمت‌های فایل رستری” مراجعه کنید)، ساختار داده TIN هر رأس مثلث را به‌عنوان یک مقدار دقیق ارتفاع در یک نقطه خاص مدل می‌کند. قوس‌های بین هر رأس نشان‌دهنده ارتفاع بین دو رأس هستند و این کمان‌ها در مثلث‌ها جمع می‌شوند. از این ساختار می‌توان برای استخراج اطلاعاتی مانند ارتفاع، شیب، جنبه و مساحت سطح در کل مدل استفاده کرد. توجه داشته باشید که عبارت “نامنظم” در نام مدل داده به این اشاره دارد که رأس‌ها معمولاً به‌صورت پراکنده قرار می‌گیرند.

شکل ۵٫۱۰ شبکه نامنظم مثلثی (TIN)

استفاده از TIN‌ها مزایای خاصی را نسبت به مدل‌های ارتفاعی مبتنی بر رستربه همراه دارد (برای اطلاعات بیشتر به قسمت “فرمت‌های فایل Raster” مراجعه کنید). اولاً، عوارض توپوگرافی خطی در TIN‌ها با دقت بیشتری نسبت به مدل‌های رستری نمایش داده می‌شوند. دوم، برای نشان دادن یک سطح در TIN‌ها تعداد نسبتاً کمی از نقاط داده مورد نیاز است، بنابراین اندازه فایل معمولاً بسیار کوچک‌تر از مدل‌های رستری است. این امر به‌ویژه در مناطقی که پیچیدگی‌های توپوگرافی زیاد است، صادق است؛ چرا که رئوس می‌توانند در این مناطق بیشتر و در مناطقی با توپوگرافی ساده‌تر کمتر پراکنده شوند. سوم، در صورت کافی نبودن داده‌ها یا نیاز به دقت بیشتر، می‌توان با افزودن رئوس اضافی، داده‌های ارتفاعی خاص را به مدل اضافه کرد. در نهایت، برخی آمار فضایی خاص می‌توانند از مدل‌های TIN استخراج شوند که در مدل‌های ارتفاعی مبتنی بر رستری قابل محاسبه نیستند؛ به‌عنوان‌مثال، ترسیم دشت‌های سیلابی، منحنی‌های ظرفیت ذخیره‌سازی مخازن و منحنی‌های منطقه‌ای برای هیدروگراف‌ها.

فرمت های فایل رستری

استفاده از TIN‌ها مزایای خاصی را نسبت به مدل‌های ارتفاعی مبتنی بر رستری به همراه دارد (برای اطلاعات بیشتر به بخش ۵٫۳٫۲ “فرمت‌های فایل Raster” مراجعه کنید). اولاً، عوارض توپوگرافی خطی در TIN‌ها با دقت بیشتری نسبت به مدل‌های رستری نمایش داده می‌شوند. دوم، برای نشان دادن یک سطح در TIN‌ها تعداد نسبتاً کمی از نقاط داده مورد نیاز است، بنابراین اندازه فایل معمولاً بسیار کوچک‌تر از مدل‌های رستری است. این امر به‌ویژه در مناطقی که پیچیدگی‌های توپوگرافی زیاد است، صادق است؛ چرا که رئوس می‌توانند در این مناطق بیشتر و در مناطقی با توپوگرافی ساده‌تر کمتر پراکنده شوند. سوم، در صورت کافی نبودن داده‌ها یا نیاز به دقت بیشتر، می‌توان با افزودن رئوس اضافی، داده‌های ارتفاعی خاص را به مدل اضافه کرد. در نهایت، برخی آمار فضایی خاص می‌توانند از مدل‌های TIN استخراج شوند که در مدل‌های ارتفاعی مبتنی بر رستری قابل محاسبه نیستند؛ به‌عنوان‌مثال، ترسیم دشت‌های سیلابی، منحنی‌های ظرفیت ذخیره‌سازی مخازن و منحنی‌های منطقه‌ای برای هیدروگراف‌ها.

شکل ۵٫۱۱ مدل رقومی سطح (سمت چپ) و مدل رقومی زمین (راست)

DEM های USGS را می توان به یکی از چهار سطح کیفیت (با برچسب ۱ تا ۴) بسته به داده های منبع و وضوح آن طبقه بندی کرد. این داده منبع می تواند ۱:۲۴۰۰۰-; ۱:۶۳,۳۶۰-; یا چهارضلعی های توپوگرافی در مقیاس ۱:۲۵۰۰۰۰٫ فرمت DEM یک فایل منفرد از متن ASCII است که از سه بلوک داده تشکیل شده است. A، B و C. بلوک A حاوی اطلاعات هدر مانند مبدا داده، نوع و سیستم های اندازه گیری است. بلوک B حاوی داده های ارتفاعی پیوسته است که به عنوان یک عدد صحیح شش کاراکتری توصیف می شود. بلوک C حاوی اطلاعات تریلر مانند خطای ریشه میانگین مربع (RMS) صحنه است. فرمت DEM USGS اخیراً توسط فرمت DEM USGS SDTS (Spatial Data Transfer Standard) DEM جایگزین شده است. فرمت SDTS USGS. 2010. “SDTS چیست؟ ” USGS، http://mcmcweb.er.usgs.gov/sdts/whatsdts.html .به طور خاص به عنوان یک فرمت توزیع برای انتقال داده ها از یک رایانه به رایانه دیگر با از دست دادن داده صفر توسعه داده شد.

فرمت DTED (Digital Terrain Elevation Data) یکی دیگر از فرمت های فایل شطرنجی مخصوص ارتفاع است. در دهه ۱۹۷۰ برای اهداف نظامی مانند تجزیه و تحلیل خط دید، تجسم سه بعدی و برنامه ریزی ماموریت توسعه یافت. فرمت DTED سه سطح داده را در پنج ناحیه عرضی مختلف نگهداری می کند. داده های سطح ۰ دارای وضوح تقریبی ۹۰۰ متر است. داده های سطح ۱ دارای وضوح تقریبی ۹۰ متر است. و داده های سطح ۲ دارای وضوح تقریبی ۳۰ متر است.

فرمت های فایل ترکیبی

پایگاه داده جغرافیایی یک فرمت فایل اختصاصی ESRI است که به‌تازگی توسعه یافته و از مجموعه‌ داده‌های برداری و شطرنجی (مانند نقاط، خطوط، چندضلعی‌ها، حاشیه‌نویسی، JPEG، TIFF) در یک فایل واحد پشتیبانی می‌کند. این فرمت روابط توپولوژیکی را حفظ کرده و به‌عنوان یک فایل MDB ذخیره می‌شود. پایگاه داده جغرافیایی به‌عنوان یک مدل جامع برای ارائه و مدل‌سازی اطلاعات مکانی طراحی شده است.

سه نوع مختلف پایگاه داده جغرافیایی وجود دارد:

  1. پایگاه داده جغرافیایی شخصی: این نوع پایگاه داده برای ویرایش تک‌کاربره توسعه یافته است و به این معناست که دو ویرایشگر نمی‌توانند به‌طور همزمان روی یک پایگاه داده جغرافیایی کار کنند. پایگاه داده جغرافیایی شخصی از فرمت فایل DBMS مایکروسافت اکسس استفاده کرده و محدودیت اندازه ۲ گیگابایت برای هر فایل را دارد. البته، پس از نزدیک شدن اندازه فایل به ۲۵۰ مگابایت، عملکرد شروع به کاهش می‌کند. این نوع پایگاه داده‌ها در حال حاضر توسط ESRI حذف شده‌اند و دیگر برای ایجاد داده‌های جدید توصیه نمی‌شوند.
  2. پایگاه داده جغرافیایی فایل: مانند پایگاه داده جغرافیایی شخصی، این نوع نیز ویرایش تک‌کاربره را مجاز می‌سازد، اما محدودیت‌های آن فقط برای مجموعه داده‌های ویژگی منحصر به فرد در یک پایگاه داده اعمال می‌شود. پایگاه داده جغرافیایی فایل شامل ابزارهای جدیدی مانند دامنه‌ها (قوانین اعمال‌شده بر ویژگی‌ها)، انواع فرعی (گروه‌هایی از اشیاء با کلاس ویژگی یا جدول) و سیاست‌های تقسیم/ادغام (قوانینی برای کنترل و تعریف عملیات تقسیم و ادغام) است. این فرمت اطلاعات را به‌صورت فایل‌های باینری با محدودیت اندازه ۱ ترابایت ذخیره می‌کند و عملکرد و مقیاس بسیار کارآمدتری نسبت به پایگاه داده‌های جغرافیایی شخصی دارد. علاوه بر این، پایگاه داده‌های جغرافیایی فایل به هیچ سیستم مدیریت پایگاه داده رابطه‌ای خاصی وابسته نیستند و می‌توانند در هر دو سیستم‌عامل ویندوز و یونیکس استفاده شوند.
  3. پایگاه داده جغرافیایی ArcSDE: این فرمت به ویرایشگرهای متعدد اجازه می‌دهد تا به‌طور همزمان روی مجموعه داده‌های ویژگی در یک پایگاه داده واحد جغرافیایی کار کنند (که به آن نسخه‌ سازی گفته می‌شود). مانند پایگاه داده جغرافیایی فایل، این فرمت نیز در هر دو سیستم‌عامل ویندوز و یونیکس قابل استفاده است. حجم فایل در این فرمت به ۴ گیگابایت محدود شده و برای استفاده از آن نیاز به مجوز ArcInfo یا ArcEditor است. پایگاه داده جغرافیایی ArcSDE بر روی بسته نرم‌افزاری SQL Server Express پیاده‌سازی شده است، که یک پلتفرم رایگان DBMS است که توسط مایکروسافت توسعه یافته است.

علاوه بر پایگاه داده‌های جغرافیایی، PDF جغرافیایی (فرمت سند قابل حمل از Adobe Systems Incorporated) یک فرمت متن‌باز است که امکان نمایش موجودیت‌های هندسی مانند نقاط، خطوط و چندضلعی‌ها را فراهم می‌آورد. فایل‌های PDF جغرافیایی برای یافتن و علامت‌گذاری جفت مختصات، اندازه‌گیری فواصل، بازپروژه فایل‌ها و ثبت تصاویر رستری جغرافیایی استفاده می‌شوند. این فرمت به‌ویژه مفید است، چرا که PDF به‌عنوان استاندارد ترجیحی برای اسناد وب قابل چاپ پذیرفته شده است. البته باید توجه داشت که PDF جغرافیایی نباید با GeoPDF اشتباه گرفته شود، که نسخه مارک‌شده‌ای از PDF جغرافیایی است و توسط TerraGo Technologies توسعه یافته است.

در نهایت، Google Earth از فرمت فایل ترکیبی و متن‌باز جدیدی به نام KML (زبان نشانه‌گذاری Keyhole) پشتیبانی می‌کند. فایل‌های KML نقاط، خطوط، چندضلعی‌ها، تصاویر، مدل‌های سه‌بعدی و غیره را با طول و عرض جغرافیایی و سایر اطلاعات نمای مانند شیب، عنوان، ارتفاع و غیره مرتبط می‌کنند. علاوه بر این، فایل‌های KMZ نسخه‌های فشرده‌شده فایل‌های KML هستند.

خوراکی های کلیدی

  • فرمت‌های رایج فایل برداری مورد استفاده در برنامه‌های مکانی شامل شیپ فایل ها، پوشش‌ها، TIGER/Lines، DXF‌های اتوکد و DLG هستند.
  • فرمت های رایج فایل رستری مورد استفاده در برنامه های مکانی شامل JPG، TIFF، PNG، MrSID، ECW، DRG، USGS DEM و DTED است.
  • فرمت های رایج فایل ترکیبی مورد استفاده در برنامه های مکانی شامل پایگاه های جغرافیایی (شخصی، فایل و ArcSDE) و PDF های مکانی است.

تمرینات

  1. اگر شما یک برنامه ریز شهری بودید که وظیفه ایجاد یک پایگاه داده GIS برای نقشه برداری از ویژگی های شهر را داشتید، آیا ترجیح می دادید از DLG یا DRG استفاده کنید؟مزایا و معایب استفاده از هر یک از این فرمت ها چیست؟
  2. در وب جستجو کنید و لیستی از URL ها ایجاد کنید که حاوی فایل های کاری برای هر یک از فرمت های رستری و برداری که در این بخش بحث شده است.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

خانهدربارهتماسارتباط با ما