آدرس یا URL در html
مرورگرهای وب با استفاده از آدرس اینترنتی، صفحاتی را از سرورهای وب درخواست می کنند.
از URL (Uniform Resource Locator) ها برای آدرس دهی یک سند در وب استفاده می شود.
یک آدرس وب مانند https://jobteam.ir/category/Html از قوانین سینتکسی زیر پیروی می کند:
scheme://prefix.domain:port/path/filename
توضیح سینتکس بالا:
- Scheme : نوع خدمات ایننترنتی را تعریف می کند. (می تواند http و یا https باشد)
- Prefix : یک پیشوند دامنه تعریف می کند (به صورت پیش فرض برای http مقدار www است)
- Domain : نام دامنه اینترنت را تعریف می کند (مانند jobteam.ir)
- Port : شماره پورت در هاست را مشخص می کند (به صورت پیش فرض برای http مقدار 80 است)
- Path : مسیری را در سرور مشخص می کند (در صورت حذف مسیر، فهرست اصلی سایت پیش فرض خواهد بود)
- Filename : نام یک منبع یا سند را تعریف می کند.
بیشتر بدانیم : لینک فارسی یا انگلیسی،کدام url آدرس در سئو می تواند بهتر باشد؟
طرح های رایج URL در html
همانطور که در بالا گفتیم Schemes (طرح ها)، نوع خدمات اینترنتی را تعریف می کنند، در زیر جدولی برای شما آورده ایم که تعدادی از این طرح ها را برای شما توضیح داده است.
نام طرح | کوتاه شده عبارت | استفاده برای |
---|---|---|
http | Hypertext Transfer Protocol | برای صفحات رایج رمزگذاری نشده |
https | Secure Hypertext Transfer Protocol | برای صفحات ایمن و رمزگذاری شده |
ftp | File Transfer Protocol | برای بارگیری و بارگذاری فایل ها |
file | برای یک فایل بر روی کامپیوتر شما |
رمزگذاری URL
URL ها تنها می توانند از طریق اینترنت و با مجموعه کاراکتر ASCII ارسال شوند. اگر URL حاوی کاراکتری خارج از محدوده مجموعه کاراکتر ASCII باشد، باید تبدیل به کاراکتر ASCII شود. (آموزش رمزگذاری یا انکود کاراکترها در HTML)
رمزگذاری URL کاراکترهای غیر ASCII را به فرمت قابل انتقال از طریق اینترنت تبدیل می کند.
رمزگذاری URL کاراکترهای غیر ASCII را با یک “%” و سپس یک رقم هگزادسیمال جایگزین می کند.
آدرس های اینترنتی نمی توانند فاصله داشته باشند، URL معمولا یک فضای خالی را با یک علامت جمع (+) و یا یک %20 جایگزین می کند.
نمونه های کد گذاری ASCII
مرورگر شما با توجه به مجموعه کاراکترهای مورد استفاده در صفحه شما، ورودی را رمزگذاری می کند.
UTF-8 مجموعه کاراکتر پیش فرض در HTML5 است.
در جدول زیر encoding برخی از کاراکتر ها را در دو مجموعه کاراکتر windows-1252 و UTF-8 بررسی کرده ایم.
کاراکتر | از windows-1252 | از UTF-8 |
---|---|---|
€ | %80 | %E2%82%AC |
£ | %A3 | %C2%A3 |
© | %A9 | %C2%A9 |
® | %AE | %C2%AE |
À | %C0 | %C3%80 |
Á | %C1 | %C3%81 |
 | %C2 | %C3%82 |
à | %C3 | %C3%83 |
Ä | %C4 | %C3%84 |
Å | %C5 | %C3%85 |
بیشتر بدانیم : XHTML چیست و تفاوت آن با HTML