跟著小郭郭學統計:06-機率(1)

好想要去福隆騎腳踏車吃便當

在上次我們說明了敘述性統計的方式,而在進入推論性統計前,我們要說明的是機率。
在我們要說明何謂機率時,我們就需要一些道具,比如說,一顆六面骰子。

在我們投擲一顆六面骰子並紀錄出現的點數,在這個過程中,結果是沒辦法被事先確定的,並且一次投擲只會產生一次點數,像這樣的過程我們稱之為實驗 (experiment)。

每一次擲六面骰子時,我們可以預期他的結果就是
1點、2點、3點、4點、5點、6點這六種結果的其中一個。
我們就稱這些結果為樣本點 (sample point)。

而這些樣本點會組成樣本空間 (sample space)。
所以我們可以這樣說:
在擲單顆六面骰子的實驗中,樣本空間內共有六個樣本點,也就是1點、2點、3點、4點、5點、6點。

而對於這樣的實驗中,各樣本點的機率,我們是這樣表示的:
如果我們稱實驗結果為下列任一樣本點的機率 (Probability) 為 Pi
則這些 Pi 的值會在0與1之間,


這些在樣本空間中各樣本點的 Pi 加總會等於1,


而我們把特定樣本點的集合稱為事件 (event),如果一個事件中只包含一個樣本點,比如點數為1,我們稱之為單純事件 (simple event),當一個事件中包含多個樣本點,如 點數小於三的事件中會包含點數為1或2,我們稱之為 複合事件(compound event)

一個事件的機率則等於所有屬於該事件的樣本點的機率相加。

OK,這就是我們今天的內容,在下次我們會開始講複合事件中的交集與聯集。

跟著小郭郭一起學 SQL Server-03 資料庫、資料表與資料(1)

只有沒有被當代價的人才能乾脆爽快地喊出不計代價。

OK,在上一次的內容中我們談到了如何下載並安裝 SQL Server ,以及SSMS,

在這回我們會對目前已經存在在系統中的系統資料庫做大概的說明。

在打開SSMS之後,會看到左邊有一個稱為 Object Explorer 的視窗 ,最上層的這裡會記載你的主機名稱,以及目前所運行的 SQL Server 執行個體 (instance) 的資訊 。

請點開在 Databases 旁邊的 + 號後,再點開底下的 System Databases,就會看到目前預設的四個系統資料庫,

其中, Master 資料庫存放的是系統面的資訊,包含對目前運作中的 SQL server 執行個體相關的資訊,以及系統相關設定。

MSDB 則是存放許多 SQL 內部功能,包含自動排程、警示、Mail 發送所會用到的資料,SSMS在執行時所需要的資料也會放在這裡。

Tempdb則存放連接到這個 SQL Server 的使用者建立的暫存物件,如暫存表 (temporary tables)、 索引 (indexes)、 預存程序 (stored procedures) 等等。

以及 SQL Server 建立的中繼物件 (intermediate object),如排序 ( sort) /或群組 (group) 到一半的查詢結果。

我想寫這樣已經有一堆人看不懂了,所以針對這三個資料庫,我們的目前要知道的事情如下:

除非有收到能為這些行動負責的人明確的指示,否則不要手動對這些資料庫做任何的變動,包含但不僅止於在裡面建資料表,更動裡面的資料,或更動這些資料庫的任何設定,資料庫一但因為這樣的更動而在運行上有任何狀況,要在商業環境中排除問題、重新恢復營運並追回遺失的資料或交易的成本有可能是極為可觀的,在執行任何變動前,最好都有取得負責人的書面指示或同意。

Model 資料庫則是一個模板資料庫,如果在這裡做出對資料庫設定的異動,則在建立新資料庫時,這些設定會跟著被帶出來,這個資料庫必須要存在在 SQL Server 的 執行個體中,而且在某些設定條件下可以將它設為創立tempdb時的模板,所以不要去試圖刪除它。

在看過這些系統資料庫之後,我們就來建立自己的資料庫吧,

請在 Databases 圖示上點選右鍵-New Database,

就會進入建立資料庫所使用的使用者介面,在這邊我們要介紹一些相關的知識:


我們現在在 SSMS 上所看到的資料庫,在實際上是以檔案的形式儲存在電腦中的,
所以在介面上會看到這些檔案會被建立的路徑 (Path),並且可以為檔案做自訂的命名 (File Name),
而隨著資料庫內部資料的增加,這些檔案原本所占的空間會逐漸不敷使用,所以會去制定這些檔案的初始大小 (Initial Size) ,以及每次內部資料量到達上限時,所被允許擴張的量,以及能不能容許無限擴張,(Autogrowth/Maxsize),

這些檔案會如同視窗中被分為 ROWS Data 與 Log, ROWS Data 檔案是資料檔,內存放的就是我們接下來即將在這資料庫建立的各種物件以及資料, Log 檔案是交易紀錄檔主要存放的則是資料庫內的交易紀錄,在富源資料庫時,我們就會用到這些交易紀錄。

資料檔則可以拆成多個檔案群組 (File group) 以進一步活用磁碟空間,所以在有多個檔案時,就可以指定該資料檔屬於哪個資料群組,由於目前清單中只有一個資料檔的關係,所以該資料檔自動被分類為主要檔案群組 (Primary),並不得更動,在畫面右下角有個新增資料檔的 Add,加入後,由於新的資料檔不必屬於 主要檔案群組 ,便可為其指定新的檔案群組,而要移除該檔案,則是點選 Add 旁邊的 Remove。

點選 OK

我們就可以看到新的資料庫出現在左邊的 Object Explorer 中了,如果沒有看到,就請對著 Databases 點選右鍵-Refresh。


而到這邊我們可以看得出資料庫是屬於執行個體內的一部分,而在下次我們則要講解資料庫中的 Schema、以及 Schema 與資料表的關係。