فرمت های فایل
هدف یادگیری
هدف این محتوا، بررسی اجمالی نمونهای از رایجترین انواع فرمتهای فایلهای برداری، رستری و ترکیبی است.دادههای مکانی در فرمتهای مختلف فایل ذخیره میشوند و هر بسته نرمافزاری سیستم اطلاعات جغرافیایی (GIS) و هر نسخه از این بستهها، فرمتهای خاص خود را پشتیبانی میکند. این موضوع برای دادههای برداری و رستری صدق میکند. اگرچه در اینجا چند فرمت فایل رایج خلاصه شده است، اما فرمتهای بسیاری نیز برای استفاده در برنامههای مختلف GIS وجود دارند.
فرمت های فایل برداری
رایجترین فرمت فایل برای دادههای برداری، Shapefile است. این فرمت که توسط ESRI در اوایل دهه ۱۹۹۰ برای استفاده در بسته نرمافزاری مدیریت پایگاه داده dBASE III در ArcView 2 توسعه یافت، فایلهایی ساده و غیرتوپولوژیکی است که برای ذخیرهسازی موقعیت هندسی و اطلاعات عوارض جغرافیایی طراحی شدهاند. Shapefile قادر به ذخیره مقادیر null و همچنین حاشیهنویسی یا ویژگیهای شبکه نیست. علاوه بر این، نام فیلدها در جدول ویژگیها به ده کاراکتر محدود میشود و هر shapefile میتواند تنها ویژگیهای نقطهای، خطی یا چندضلعی را نمایندگی کند. انواع دادههای پشتیبانیشده شامل ممیز شناور، عدد صحیح، تاریخ و متن هستند. این فرمت تقریباً توسط تمام نرمافزارهای تجاری و متنباز GIS پشتیبانی میشود.
با وجود این که این فرمت به عنوان “شیپ فایل” شناخته میشود، در واقع مجموعهای از فایلهای مختلف است. جدول ۵٫۱ “انواع فایل Shapefile”، فرمتهای مختلف فایل مرتبط با shapefile را فهرست کرده و توضیح میدهد. در میان این فرمتها، تنها فایلهای SHP، SHX و DBF برای ایجاد یک shapefile الزامی هستند، در حالی که دیگر فرمتها اختیاری و مشروط به استفاده هستند. به عنوان یک قاعده کلی، هنگام استفاده از نسخههای قدیمی بستههای نرمافزاری GIS، نام هر فایل باید مطابق با قرارداد MS-DOS 8.3 باشد. طبق این قرارداد، پیشوند نام فایل میتواند حداکثر ۸ کاراکتر و پسوند آن باید سه کاراکتر باشد. بستههای نرمافزاری جدیدتر GIS این محدودیت را کاهش داده و پیشوندهای طولانیتری را میپذیرند.
جدول ۵٫۱ انواع فایل Shapefile
فرمت فایل | هدف |
SHP* | هندسه ویژگی |
SHX* | قالب شاخص برای هندسه ویژگی |
DBF* | اطلاعات ویژگی ها را در قالب dBASE IV مشخص کنید |
PRJ | اطلاعات پروجکشن |
SBN و SBX | شاخص فضایی ویژگی ها |
FBN و FBX | شاخص فضایی فقط خواندنی ویژگی ها |
AIN و AIH | اطلاعات مربوط به فیلدهای فعال در جدول را مشخص کنید |
IXS | فهرست ژئوکدینگ برای شکل فایلهای خواندن و نوشتن |
MXS | ایندکس ژئوکدینگ برای فایل های شکلی خواندن و نوشتن با فرمت ODB |
ATX | شاخص مشخصه مورد استفاده در ArcGIS 8 به بعد |
SHP.XML | متادیتا در قالب XML |
CPG | مشخصات صفحه کد برای شناسایی رمزگذاری کاراکترها |
* فایل های اجباری را نشان می دهد |
اولین فرمت فایل برداری برای استفاده در بستههای نرمافزاری GIS که هنوز هم مورد استفاده قرار میگیرد، پوشش ArcInfo است. این فرمت فایل جغرافیایی از انواع مختلف ویژگیها (مانند نقاط، خطوط، چندضلعیها، annotations) پشتیبانی میکند و در عین حال اطلاعات توپولوژیکی مرتبط با آن ویژگیها را نیز ذخیره میکند. دادههای عوارض بهصورت فایلهای متعدد در یک فهرست جداگانه به نام “اطلاعات” ذخیره میشوند. به دلیل توسعه آن در محیط MS-DOS، این فایلها محدودیتهای نامگذاری خاصی دارند. بهطور مثال، نام فایلها نمیتوانند بیشتر از ۱۳ کاراکتر باشند، نباید حاوی فاصله باشند، نمیتوانند با عدد شروع شوند و باید تماماً به حروف کوچک نوشته شوند. پوششها را نمیتوان در نسخههای ArcGIS 9.x یا نسخههای جدیدتر بسته نرمافزاری ESRI ویرایش کرد.
اداره سرشماری ایالات متحده نوع خاصی از shapefile به نام TIGER یا TIGER/Line (سیستم رمزگذاری و ارجاع جغرافیایی یکپارچه توپولوژیکی) نگهداری میکند. اگرچه این فایلهای متنباز حاوی اطلاعات واقعی سرشماری نیستند، اما ویژگیهایی مانند مسیرهای سرشماری، جادهها، راهآهنها، ساختمانها، رودخانهها و سایر عوارض را ترسیم میکنند که از اداره پشتیبانی و بهبود مییابند و توانایی اداره برای جمعآوری اطلاعات سرشماری را افزایش میدهند. فایلهای TIGER/Line که برای اولین بار در سال ۱۹۹۰ منتشر شدند، از نظر توپولوژیکی دقیق هستند و با فایل آدرس اصلی اداره سرشماری (MAF) مرتبط میباشند، به این ترتیب امکان کدگذاری جغرافیایی آدرسهای خیابانی را فراهم میکنند. این فایلها برای عموم رایگان بوده و میتوانند بهطور رایگان از فروشندگان خصوصی که این فرمت را پشتیبانی میکنند، دانلود شوند.
اتوکد DXF (فرمت تبادل نقشه) یک فرمت فایل برداری اختصاصی است که توسط Autodesk ایجاد شده تا امکان تبادل بین نرمافزار CAD مبتنی بر طراحی به کمک کامپیوتر (CAD) و سایر بستههای نرمافزاری نقشهبرداری را فراهم کند. فایلهای DXF برای اولین بار در سال ۱۹۸۲ با هدف ارائه نمایش دقیق فرمت بومی DWG اتوکد منتشر شدند. اگرچه DXF هنوز هم بهطور گسترده استفاده میشود، نسخههای جدیدتر اتوکد انواع دادههای پیچیدهتری مانند مناطق و بلوکهای پویا را در خود جای دادهاند که در قالب DXF پشتیبانی نمیشوند. بنابراین، این فرمت ممکن است در تحلیلهای مکانی بهمرور زمان کمتر محبوب شود.
در نهایت، سازمان زمینشناسی ایالات متحده (USGS) یک فرمت فایل برداری متنباز را حفظ میکند که اطلاعات فیزیکی و فرهنگی را در سراسر ایالات متحده نمایان میسازد. این فایلها که بهعنوان DLG (گرافیک خط رقومی) شناخته میشوند، بسته به مقیاس نقشهبرداری، به سه دسته بزرگ، متوسط و کوچک تقسیم میشوند: ۱:۲۴۰۰۰، ۱:۱۰۰۰۰۰ و ۱:۲۰۰۰۰۰۰٫ ویژگیهای موجود در انواع مختلف DLG بستگی به مقیاس آن دارند، اما بهطور کلی شامل دادههایی مانند مرزهای اداری و سیاسی، هیدروگرافی، سیستمهای حمل و نقل، هیپوگرافی و پوشش زمین است.
فایلهای داده برداری همچنین میتوانند برای نمایش اطلاعات ارتفاع سطح ساختاری استفاده شوند. TIN (شبکه نامنظم مثلثی) یک ساختار داده برداری متنباز است که از مثلثهای به هم پیوسته و غیرهمپوشانی برای نمایش سطوح جغرافیایی استفاده میکند. در حالی که تصویر رستری ارتفاع را بهصورت میانگین در هر پیکسل نشان میدهد (برای اطلاعات بیشتر به پست “فرمتهای فایل رستری” مراجعه کنید)، ساختار داده TIN هر رأس مثلث را بهعنوان یک مقدار دقیق ارتفاع در یک نقطه خاص مدل میکند. قوسهای بین هر رأس نشاندهنده ارتفاع بین دو رأس هستند و این کمانها در مثلثها جمع میشوند. از این ساختار میتوان برای استخراج اطلاعاتی مانند ارتفاع، شیب، جنبه و مساحت سطح در کل مدل استفاده کرد. توجه داشته باشید که عبارت “نامنظم” در نام مدل داده به این اشاره دارد که رأسها معمولاً بهصورت پراکنده قرار میگیرند.
شکل ۵٫۱۰ شبکه نامنظم مثلثی (TIN)
استفاده از TINها مزایای خاصی را نسبت به مدلهای ارتفاعی مبتنی بر رستربه همراه دارد (برای اطلاعات بیشتر به قسمت “فرمتهای فایل Raster” مراجعه کنید). اولاً، عوارض توپوگرافی خطی در TINها با دقت بیشتری نسبت به مدلهای رستری نمایش داده میشوند. دوم، برای نشان دادن یک سطح در TINها تعداد نسبتاً کمی از نقاط داده مورد نیاز است، بنابراین اندازه فایل معمولاً بسیار کوچکتر از مدلهای رستری است. این امر بهویژه در مناطقی که پیچیدگیهای توپوگرافی زیاد است، صادق است؛ چرا که رئوس میتوانند در این مناطق بیشتر و در مناطقی با توپوگرافی سادهتر کمتر پراکنده شوند. سوم، در صورت کافی نبودن دادهها یا نیاز به دقت بیشتر، میتوان با افزودن رئوس اضافی، دادههای ارتفاعی خاص را به مدل اضافه کرد. در نهایت، برخی آمار فضایی خاص میتوانند از مدلهای TIN استخراج شوند که در مدلهای ارتفاعی مبتنی بر رستری قابل محاسبه نیستند؛ بهعنوانمثال، ترسیم دشتهای سیلابی، منحنیهای ظرفیت ذخیرهسازی مخازن و منحنیهای منطقهای برای هیدروگرافها.
فرمت های فایل رستری
استفاده از TINها مزایای خاصی را نسبت به مدلهای ارتفاعی مبتنی بر رستری به همراه دارد (برای اطلاعات بیشتر به بخش ۵٫۳٫۲ “فرمتهای فایل Raster” مراجعه کنید). اولاً، عوارض توپوگرافی خطی در TINها با دقت بیشتری نسبت به مدلهای رستری نمایش داده میشوند. دوم، برای نشان دادن یک سطح در TINها تعداد نسبتاً کمی از نقاط داده مورد نیاز است، بنابراین اندازه فایل معمولاً بسیار کوچکتر از مدلهای رستری است. این امر بهویژه در مناطقی که پیچیدگیهای توپوگرافی زیاد است، صادق است؛ چرا که رئوس میتوانند در این مناطق بیشتر و در مناطقی با توپوگرافی سادهتر کمتر پراکنده شوند. سوم، در صورت کافی نبودن دادهها یا نیاز به دقت بیشتر، میتوان با افزودن رئوس اضافی، دادههای ارتفاعی خاص را به مدل اضافه کرد. در نهایت، برخی آمار فضایی خاص میتوانند از مدلهای TIN استخراج شوند که در مدلهای ارتفاعی مبتنی بر رستری قابل محاسبه نیستند؛ بهعنوانمثال، ترسیم دشتهای سیلابی، منحنیهای ظرفیت ذخیرهسازی مخازن و منحنیهای منطقهای برای هیدروگرافها.
شکل ۵٫۱۱ مدل رقومی سطح (سمت چپ) و مدل رقومی زمین (راست)
DEM های USGS را می توان به یکی از چهار سطح کیفیت (با برچسب ۱ تا ۴) بسته به داده های منبع و وضوح آن طبقه بندی کرد. این داده منبع می تواند ۱:۲۴۰۰۰-; ۱:۶۳,۳۶۰-; یا چهارضلعی های توپوگرافی در مقیاس ۱:۲۵۰۰۰۰٫ فرمت DEM یک فایل منفرد از متن ASCII است که از سه بلوک داده تشکیل شده است. A، B و C. بلوک A حاوی اطلاعات هدر مانند مبدا داده، نوع و سیستم های اندازه گیری است. بلوک B حاوی داده های ارتفاعی پیوسته است که به عنوان یک عدد صحیح شش کاراکتری توصیف می شود. بلوک C حاوی اطلاعات تریلر مانند خطای ریشه میانگین مربع (RMS) صحنه است. فرمت DEM USGS اخیراً توسط فرمت DEM USGS SDTS (Spatial Data Transfer Standard) DEM جایگزین شده است. فرمت SDTS USGS. 2010. “SDTS چیست؟ ” USGS، http://mcmcweb.er.usgs.gov/sdts/whatsdts.html .به طور خاص به عنوان یک فرمت توزیع برای انتقال داده ها از یک رایانه به رایانه دیگر با از دست دادن داده صفر توسعه داده شد.
فرمت DTED (Digital Terrain Elevation Data) یکی دیگر از فرمت های فایل شطرنجی مخصوص ارتفاع است. در دهه ۱۹۷۰ برای اهداف نظامی مانند تجزیه و تحلیل خط دید، تجسم سه بعدی و برنامه ریزی ماموریت توسعه یافت. فرمت DTED سه سطح داده را در پنج ناحیه عرضی مختلف نگهداری می کند. داده های سطح ۰ دارای وضوح تقریبی ۹۰۰ متر است. داده های سطح ۱ دارای وضوح تقریبی ۹۰ متر است. و داده های سطح ۲ دارای وضوح تقریبی ۳۰ متر است.
فرمت های فایل ترکیبی
پایگاه داده جغرافیایی یک فرمت فایل اختصاصی ESRI است که بهتازگی توسعه یافته و از مجموعه دادههای برداری و شطرنجی (مانند نقاط، خطوط، چندضلعیها، حاشیهنویسی، JPEG، TIFF) در یک فایل واحد پشتیبانی میکند. این فرمت روابط توپولوژیکی را حفظ کرده و بهعنوان یک فایل MDB ذخیره میشود. پایگاه داده جغرافیایی بهعنوان یک مدل جامع برای ارائه و مدلسازی اطلاعات مکانی طراحی شده است.
سه نوع مختلف پایگاه داده جغرافیایی وجود دارد:
- پایگاه داده جغرافیایی شخصی: این نوع پایگاه داده برای ویرایش تککاربره توسعه یافته است و به این معناست که دو ویرایشگر نمیتوانند بهطور همزمان روی یک پایگاه داده جغرافیایی کار کنند. پایگاه داده جغرافیایی شخصی از فرمت فایل DBMS مایکروسافت اکسس استفاده کرده و محدودیت اندازه ۲ گیگابایت برای هر فایل را دارد. البته، پس از نزدیک شدن اندازه فایل به ۲۵۰ مگابایت، عملکرد شروع به کاهش میکند. این نوع پایگاه دادهها در حال حاضر توسط ESRI حذف شدهاند و دیگر برای ایجاد دادههای جدید توصیه نمیشوند.
- پایگاه داده جغرافیایی فایل: مانند پایگاه داده جغرافیایی شخصی، این نوع نیز ویرایش تککاربره را مجاز میسازد، اما محدودیتهای آن فقط برای مجموعه دادههای ویژگی منحصر به فرد در یک پایگاه داده اعمال میشود. پایگاه داده جغرافیایی فایل شامل ابزارهای جدیدی مانند دامنهها (قوانین اعمالشده بر ویژگیها)، انواع فرعی (گروههایی از اشیاء با کلاس ویژگی یا جدول) و سیاستهای تقسیم/ادغام (قوانینی برای کنترل و تعریف عملیات تقسیم و ادغام) است. این فرمت اطلاعات را بهصورت فایلهای باینری با محدودیت اندازه ۱ ترابایت ذخیره میکند و عملکرد و مقیاس بسیار کارآمدتری نسبت به پایگاه دادههای جغرافیایی شخصی دارد. علاوه بر این، پایگاه دادههای جغرافیایی فایل به هیچ سیستم مدیریت پایگاه داده رابطهای خاصی وابسته نیستند و میتوانند در هر دو سیستمعامل ویندوز و یونیکس استفاده شوند.
- پایگاه داده جغرافیایی ArcSDE: این فرمت به ویرایشگرهای متعدد اجازه میدهد تا بهطور همزمان روی مجموعه دادههای ویژگی در یک پایگاه داده واحد جغرافیایی کار کنند (که به آن نسخه سازی گفته میشود). مانند پایگاه داده جغرافیایی فایل، این فرمت نیز در هر دو سیستمعامل ویندوز و یونیکس قابل استفاده است. حجم فایل در این فرمت به ۴ گیگابایت محدود شده و برای استفاده از آن نیاز به مجوز ArcInfo یا ArcEditor است. پایگاه داده جغرافیایی ArcSDE بر روی بسته نرمافزاری SQL Server Express پیادهسازی شده است، که یک پلتفرم رایگان DBMS است که توسط مایکروسافت توسعه یافته است.
علاوه بر پایگاه دادههای جغرافیایی، PDF جغرافیایی (فرمت سند قابل حمل از Adobe Systems Incorporated) یک فرمت متنباز است که امکان نمایش موجودیتهای هندسی مانند نقاط، خطوط و چندضلعیها را فراهم میآورد. فایلهای PDF جغرافیایی برای یافتن و علامتگذاری جفت مختصات، اندازهگیری فواصل، بازپروژه فایلها و ثبت تصاویر رستری جغرافیایی استفاده میشوند. این فرمت بهویژه مفید است، چرا که PDF بهعنوان استاندارد ترجیحی برای اسناد وب قابل چاپ پذیرفته شده است. البته باید توجه داشت که PDF جغرافیایی نباید با GeoPDF اشتباه گرفته شود، که نسخه مارکشدهای از PDF جغرافیایی است و توسط TerraGo Technologies توسعه یافته است.
در نهایت، Google Earth از فرمت فایل ترکیبی و متنباز جدیدی به نام KML (زبان نشانهگذاری Keyhole) پشتیبانی میکند. فایلهای KML نقاط، خطوط، چندضلعیها، تصاویر، مدلهای سهبعدی و غیره را با طول و عرض جغرافیایی و سایر اطلاعات نمای مانند شیب، عنوان، ارتفاع و غیره مرتبط میکنند. علاوه بر این، فایلهای KMZ نسخههای فشردهشده فایلهای KML هستند.
خوراکی های کلیدی
- فرمتهای رایج فایل برداری مورد استفاده در برنامههای مکانی شامل شیپ فایل ها، پوششها، TIGER/Lines، DXFهای اتوکد و DLG هستند.
- فرمت های رایج فایل رستری مورد استفاده در برنامه های مکانی شامل JPG، TIFF، PNG، MrSID، ECW، DRG، USGS DEM و DTED است.
- فرمت های رایج فایل ترکیبی مورد استفاده در برنامه های مکانی شامل پایگاه های جغرافیایی (شخصی، فایل و ArcSDE) و PDF های مکانی است.
تمرینات
- اگر شما یک برنامه ریز شهری بودید که وظیفه ایجاد یک پایگاه داده GIS برای نقشه برداری از ویژگی های شهر را داشتید، آیا ترجیح می دادید از DLG یا DRG استفاده کنید؟مزایا و معایب استفاده از هر یک از این فرمت ها چیست؟
- در وب جستجو کنید و لیستی از URL ها ایجاد کنید که حاوی فایل های کاری برای هر یک از فرمت های رستری و برداری که در این بخش بحث شده است.