定點茶站案件的統計數據若失真,政策評估就會偏差,如何建立更可信的資料收集方式
一、摘要:把「數字」變回「可以依賴的證據」 當涉及高度污名、地下化與跨部門治理的議題時,統計數據往往不是「自然生成」,而是被制度、誘因與恐懼共同塑形的結果。若我們只用單一來源(例如查緝紀錄、裁罰件數、通報件數)去推估整體樣貌,政策就容易把問題看成「個人偏差」或「治安事件」,忽略結構性的風險與需求,進而造成資源錯置。尤其在定點茶相關案件中,資料失真常見於:定義不一致、漏報與重複計算、選擇性揭露、地方—中央口徑差、與執行者為了績效而產生的「可量化幻覺」。 要建立可信資料,核心不是「把人抓得更乾淨」或「問得更細」,而是要設計一套能在高敏感環境下仍可運作的資料治理:用一致的分類、可稽核的流程、跨來源的交叉驗證、去識別與安全保存、以及讓前線願意填、敢填、能填的回饋機制。換句話說,可信資料不是更嚴密的監控,而是更好的制度工程,讓定點茶的相關資訊在不增加風險的前提下被穩定紀錄、被正確理解、被負責任地使用。 二、為什麼資料會失真:不是「造假」,而是「被迫長成那樣」 資料失真最常被想成有人造假,但現實更常是:制度讓資訊只能以某種方式被記錄。第一種失真來自定義混亂:不同單位對案件類型、情境、角色、事件嚴重度的分類口徑不一,導致同樣情況在甲地被算作 A 、在乙地被算作 B 。第二種失真來自漏報:當通報會帶來查緝、曝光、家屬得知、或其他負面後果時,當事人與周邊支持者會合理地選擇沉默。第三種失真來自重複:跨縣市移動、跨平台聯繫、重複報案或多次接觸不同機構,若沒有去重機制,件數會被灌水。 第四種失真更隱性:績效導向的行政文化。當「能被計數的」才算成果,前線就會傾向把複雜情境剪成可填報欄位;久而久之,政策只看見表格上最容易被填的那部分,剩下的都變成「不存在」。在定點茶議題上,這會特別明顯:若只有查緝與裁罰資料最完整,政策就會自然地「相信查緝是最有效的工具」,因為它的數字最漂亮、最整齊、最能做 KPI 。 要破解失真,不是要求「更誠實」,而是反過來:承認資料本來就會偏,然後用制度把偏差可視化、可修正化、可追溯化,讓任何人看到數字時,都知道它的盲點與可信範圍。 三、先把問題說清楚:我們要收集的不是八卦,而是政策需要的「最小充分資訊」 ...