# 第一章 緒論

Directly-sequence code-division multiple access(DS-CDMA)[1,2]普遍 被認為很適用於第三代通訊系統。在 DS-CDMA 系統中,所有使用者共同分享有限 的頻寬和時間資源。每一個使用者都會先被分配到一組 pseudo -noise(PN)碼, 而使用者彼此之間的 PN 碼是正交的。然而由於非同步的傳輸,導致在接收端時 PN 碼之間的正交性難以維持,因此 multi-access interference(IMI)就產生了。 一個傳統的 DS-CDMA 接收機,把這種干擾視為雜訊,使用相關器(correlator) 將接收到的信號作解展頻(dispread)。傳統的 DS-CDMA 接收機各自獨立偵測每個 使用者的信號,而不考慮其他信號的影響。通常 MAI 對系統的效能和容量有非常 大的影響。單獨一個使用者所造成的 MAI 影響通常很小,但是當使用者數目越來 越大時, MAI 對系統的影響也越來越大。在某些情況下,雖然使用者數目並不多, 但是 MAI 還是對系統的效能造成了不小的影響,這是由於其他干擾的信號的功率 比想要的信號的功率強的原因,此種效應稱為遠近效應(near-far effect)。

有很多在如何解決 MAI 和遠近效應的論文,其方法是用多使用者接收機來解 決問題。在這些論文中,不將其他使用者的信號視為雜訊,而是同時一起偵測所 有信號,這是一個相較於傳統接收器不一樣的觀點。近年來,有很多不一樣的多 使用者接收機被提出。Verdu 首先提出了最佳多使用者接收機(optimal multi-user detector)[3,4],他的做法是建立在 maximum likelihood function 的基礎之上所得到的。同時他也證明了相較於傳統的接收機,最佳多重使用者接 收機改善 DS-CDMA 的容量和效能非常大。然而最佳多重使用者接收機的計算複雜 度隨著使用者數目的增加,呈現指數性的成長而難以實現,這是其缺點。因此接 下來有很多次佳多使用者偵測器(sub-optimal multi-user detector)的論文被 提出。

這些次佳多使用者偵測器,主要可分為兩種類型。一種是線性多使用者偵測器(linear multi-user detector),另外一種是干擾消除多使用者偵測器

1

(subtractive interference cancellation multi-user detector)。線性多使用者偵測器包括了解相關(decorrelating)偵測器,最小平均平方誤差(minimum mean-squared error)偵測器,都是在傳統接收機的相關器的輸出上作線性轉換(linear transform)來消除 MAI。這些偵測器都需要對大矩陣作運算,因此計算量很大,這是其缺點。

干擾消除偵測器試著估測由其他信號所產生的 MAI,然後再將其扣除掉。此 類型的偵測器包括了連續干擾消除偵測器 (successive interference cancellation:SIC)和平行干擾消除 (parallel interference cancellation:PIC) 偵測器。SIC 偵測器的效能比 PIC 好一點,但是需要作功率重新排列 (power reordering)的動作,因此需要較長的處理時間,此為其缺點。因此 PIC 是在實 際的應用中最可行的一種偵測器。但 PIC 偵測器估測的 MAI 如果不是很準確的 話,反而會降低效能。所以後來又有人提出了部分平行干擾消除 (Partial PIC) 偵測器 [7,8]。在部分平行干擾消除 偵測器中,使用 partial cancellation factors (PCF)來反映 MAI 的可信度。若 MAI 估測可信度比較低時,則 PCF 的值 會較小;當可信度高時, PCF 的值會變大。在多級部份平行干擾消除 (真測器中, 由於越後面的層級的 MAI 估測越準確,所以 PCF 值會越大。

本論文的目的是提出一個最小平均平方誤差(minimum mean square error) 的方法來得到部分平行干擾消除偵測器的 PCF 值。並且在 FPGA 上實現吾人所提 出的接收機的架構,且整合碼擷取電路及頻率偏移估測電路使接收機更為完整。 在吾人所提出的接收機的架構中,為了降低硬體複雜度,吾人設計的接收機的架 構是兩級的。在第一級中,信號經過每個使用者的相關器,得到暫時性的 soft decisions 並各自重新產生想要接收的信號。藉由這些重新產生的信號,每個使 用者可以將其他使用者造成的 MAI 扣除掉,如前所述 PCF 則是用來決定每個使用 者信號的 MAI 的可信度。而扣除掉 MAI 的信號經過第二級相關器得到最後的位元 決策。此外吾人也使用了 noncoherent code tracking loop 來估測 timing error,再用 interpolation filter 使用估測的 timing error 得到正確相位的 信號。

本篇論文的內容編排如下。第二章,吾人介紹 WCDMA 通訊系統的特性並介紹 其上鏈實體通道。第三章,吾人作 CDMA 系統的簡單介紹和現有多使用者偵測器 的總結。第四章,吾人詳細的介紹所提出的偵測器的架構。第五章,介紹吾人所 做的設計流程和硬體設計架構。第六章,作本篇論文的結論。



# 第二章 WCDMA 简介

2.1 序言

在1980年代初期,以類比技術及FM調變為基礎的第一代無線通訊系統已在全世界各地推展並開始運作,提供最基本的類比語音通訊,主要系統標準包括AMPS(Advanced Mobile Phone Services)、TACS(Total Access Cellular System)、NMT(Nordic Mobile Telephone)。

到了1990年代初期,開始推廣第二代無線通訊系統,它採用較為先進的數位 調變方式與語音處理技術,故能提供多樣化整合語音與數據服務,例如:傳真、 低速率的網路擷取。第二代雖然較第一代系統在設計上複雜許多,但是能夠較有 效的利用寶貴的頻譜資源,整合數據語音,及加強安全保密的機制,主要系統標 準包括歐規GSM(Global System for Mobile Communications),日本的PDC (Personal Digital Cellular),美國的IS-95與IS-136等。現今第二代系統在全 球各地蓬勃發展,擁有數億個使用者。

但是隨著科技的再進步,人們對於高速網路的擷取,影像或是高畫質圖片傳輸的寬頻服務需求將不斷的成長,及用戶數的快速的提高,第二代無線通訊系統 已不敷需求,且根據UMTS Forum 的預測,歐洲到2010 年將有百分之六十的資料 流量來自多媒體的傳輸,其主要應用分為三類[9]:

- U 電腦資料的傳輸:網際網路的擷取、電子郵件、即時影像傳輸、多媒體文件 傳輸、行動計算。
- U 電信服務: 視訊會議、寬頻資料服務、ISDN。
- U 聲訊視訊服務: 隨選視訊、互動式視訊服務、電子報。

所以未來的通訊一定要能夠提供以上的服務,所以資料的傳輸速度必須大幅 提高,而第二代行動通訊系統無法滿足這些需求,因此目前國際電訊聯盟(ITU) 積極發展第三代甚至第四代的無線行動通訊系統,以支援這些多媒體的服務。自 1980年代中期, ITU便開始研究規劃第三代系統(3G), 統合名稱為 IMT-2000(International Mobile Telecommunication),許多標準制定的組織都 參與IMT-2000標準制定的過程,包括歐洲的ETSI (European Telecommunications Standards Institute)、美國的TIA (Telecommunication Industry Association)、日本的ARIB (Association for Radio Industries and Business) 以及南韓的TTA (Telecommunications Technology Associiation)等。

無線進接系統與無線傳輸技術(Radio Transmission technology: RTT)是定 義第三代系統時的關鍵部分,至1998年,各個標準制定組織提至ITU的IMT-2000 地面無線傳輸技術之提案共有十個,如表2.1。在所有提案中,大部分採用直接 序列分碼多重存取(Direct Sequence Code Division Multiple Access: DS-CDMA),此技術有諸多優點[10],例如:高頻譜的使用率、軟性系統容量(soft capacity)、軟性轉接(soft handoff)、有效抗干擾、對抗多重路徑衰減,與可 利用梨耙式接收機(Rake receiver)增進系統效能等。

到了1998年底,已有五個組織同意共同合作來制定第三代系統之技術規格,此 技術為以GSM為核心網路與組織成員所支援的無線存取技術為基礎,這個合作計 畫稱為3GPP[11]。ITU於世界無線電會議中認定IMT-2000的頻段為1885~2025MHz 與2110~2200MHz,包括衛星通訊部分所使用的頻段1980~2010與2170~2200MHz。 圖2.1為各主要發展國無線通訊頻譜分配圖[12]。

| Proposal    | Description                                                 | Source            |  |
|-------------|-------------------------------------------------------------|-------------------|--|
| DECT        | Digital Enhanced Cordless<br>Telecommunications             | ETSI project DECT |  |
| UWC-136     | Universal Wireless<br>Communications                        | USA TIA TR45.3    |  |
| WIMS W-CDMA | Wireless multimedia and Messaging<br>Services Wideband CDMA | USA TIA 46.1      |  |
| TD-SCDMA    | Time-division synchronous CDMA                              | China CATT        |  |
| W-CDMA      | Wideband CDMA                                               | Japan ARIB        |  |
| CDMA II     | Asynchronous DS-CDMA                                        | S. Korea TTA      |  |
| UTRA        | UTMS terrestrial Radio Access                               | ETSI SMG2         |  |
| NA:W-CDMA   | North American : Wideband<br>CDMA                           | USA T1P1-ATIS     |  |
| cdma2000    | Wideband CDMA(IS-95)                                        | USA TIA TR45.5    |  |
| CDMA I      | Multi-band synchronous DS-<br>CDMA                          | S. Korea TTA      |  |

## 表 2.1 IMT-2000 地面無線傳輸技術之提案

# 2.2 IMT-2000 的目標與要求

IMT-2000的目標是整合目前所見的各個不同無線通訊系統,使成為全球通行 之系統,在不同環境下能夠提供適當的傳輸品質的多媒體服務,IMT-2000可說是 一非常具有彈性的標準,其主要特色與目標條例如下:

U 彈性的提供全球性服務。

- U 提供符合成本效益的多種存取方式,使全球人類均能使用無線行動電話。
- U 擁有相當高速的傳輸能力,包括電路式交換與分封式交換以及多媒體服務
- U 擁有高品值且健全系統,使能夠媲美有線網路。
- U 不論是地面或是衛星通訊,全球使用同一頻段。
- U 使有可全球漫遊的終端機。
- U 在各種使用環境下都支援對稱及非對稱的資料傳輸。
- U 開放式的架構,允許先進技術加入。

IMT-2000對於使用者資料速率在各個環境下有不同能力的規範如下:

- U 行車: 144Kbps
- U 行人: 384Kbps
- u 室内: 2.048Mbps
- u 衛星: 9.6Kbps
- 2.3 3GPP系統特色

目前IMT-2000各種系統中,以CDMA2000,WCDMA這兩種系統較熱門,本論文 只考慮WCDMA之系統架構,WCDMA的系統主要特色如下[13]:

U 使用較寬的頻譜

WCDMA所採用的基本頻寬為5MHz,使用較寬的頻譜會有較好的性能,因為較 寬的頻譜可以解析較多的路徑,再藉由梨耙式接收機做有效結合各有效路 徑就能對抗多路徑的效應。

#### U 提供多重速率服務

WCDMA能夠在不同環境提供不同速率、不同服務品質,此可藉由編碼的方式 來達成,利用多碼傳輸(multi-code transmission)與可變展頻因數 (variable spreading factor)可將不同傳輸速率對應到所被分配到的頻 寬。

U 快速功率控制

在WCDMA中,所有使用者使用共用相同頻帶,所以傳送功率太大就會對其他 使用者造成干擾,造成系統容量減少,快速的功率控制(fast power control) 可適當的調整傳送功率,以降低對他人的干擾。

U 非同步基地台運作

WCDMA系統使用細胞間非同步運作,主要的目的是避免使用全球定位

(Global Position System:GPS),避免智財權的問題,並且也克服了供建築物內小型基地台額外同步來源之困難。所以在WCDMA系統中發展出一套快

速基地台收尋(cell search)的規則。



U 支援適應性天線陣列

適應性天線被認定為一種可以加強系統容量的方式,但是系統必須使用額 外且專用的位元來支援此適應性天線,但在WCDMA中就有所謂的領航幅元可 供通道估測及適應性天線。

U 支援多用户偵测

在傳統的接收機只考慮一個使用者,而不去考慮其他使用者,將之視為雜 訊、干擾,所以會嚴重影響到系統的效能及容量,所以一較好的方式就是 結合其他使用者的資訊以幫助個別的使用者之偵測,此種方式稱為多用戶 偵測(multi-user detection)。

## 2.4 傳輸頻道(transport channel)

傳輸頻道是實體頻道的上層服務,依據資料如何及用什麼特性在空氣介面中 傳送來定義一個傳輸頻道。一般可將傳輸頻道定義為兩大類:共用傳輸頻道

(common transport channel)及專用傳輸頻道(dedicated transport channel)。

## 2.4.1 共用傳輸頻道

在此簡單的介紹幾個較為重要的共用傳輸頻道

#### u 廣播頻道(broadcast control channel : BCH)

用來廣播系統和基地台相關的資訊,此頻道是傳送範圍涵蓋整個細胞(cell) 並且適用較低且固定的傳送速度。此為下鏈頻道。

#### **山** 下鏈擷取頻道(forward access channel : FACH)

當系統知道使用者在那一細胞或是那一扇形區域(sector)時,使用此頻道傳送一些控制訊號,呼叫使用者,此頻道傳送範圍也是涵蓋整個細胞或是扇形區域,並使用低速的功率控制。此為下鏈頻道。

#### U 下鏈共享頻道(downlink shared channel : DSCH)

用來傳送特定的訊息給特定的幾個使用者(users),就好比目前常用的訊息 廣播,此為下鏈頻道。

## u 隨機存取頻道(random access channel : RACH)

此用來傳送使用者的控制訊號及參數,也可傳送較短和低傳輸速率的封包, 使用開路功率控制(open loop power control)。此為上鏈頻道。

## 2.4.2 專用傳輸頻道

只存在一個專用的傳輸頻道(DCH),分為上鏈及下鏈頻道。DCH用來傳送使用 者資料及一些控制訊號給單一使用者,且具有快速的功率控制,可快速變化資料 傳輸速度的特性(frame by frame)。

## 2.5 上鏈實體頻道(uplink physical channel)

實體頻道是最下層,也是直接和空氣介面傳輸的頻道,由碼框(frame)及時 槽(time slot)所組成,但也並非所有的實體頻道架構都是如此。一個碼框的長 度10ms,包含有15個時槽,所以一個時槽的長度為0.667ms,組成時槽的位元個 數由傳輸速率所決定,一個位元包含有許多切片(chip),切片的個數就是實體頻 道的展頻因數(spreading factor:SF)。實體頻道因為功能的不同,可分為共用 及專用實體頻道,當然傳輸頻道須經由實體頻道來傳送訊息,所以會有一相對應 的關係如圖2.2所示。



圖 2.2 傳輸頻道和實體頻道相對應圖

## 2.5.1 上鏈專用頻道

上鏈專用實體資料頻道(uplink DPDCH),被用來攜帶由第二層或是更高層所 產生的資料,有時會有一個、多個、甚至沒有此頻道。上鏈專用實體控制頻道 (uplink DPCCH),被用來攜帶控制的訊息,包含有領航位元(pilot bits)作通道 的估計(channel estimation),傳送功率控制位元(TPC bits),回饋訊息位元(FBI) 及傳送格式指示位元(TFCI)。TPC 為指示傳送功率做適當變化,TFCI為指示目前 此碼框的展頻因數。相對DPDCH可能並排許多頻道,DPCCH只會有一個頻道。圖2.3 是上鏈DPCCH和DPDCH碼框架構圖,很明顯可觀察出,每碼框可分成15個時槽,每個時槽可有2560個切片(chip),且每個時槽都有功率控制的位元(TPC),所以WCDMA 的功率控制速度可達到1.5kHz,可以有效的追蹤通道的變化。





圖2.3還有一參數k,此表示一個時槽可傳送多少位元,這和展頻因數(SF) 有關,其相對關係為: SF = 256/2<sup>k</sup>,因為k從0到6,所以上鏈DPDCH 展頻因數 範圍為4到256。一個時槽會有兩位元TFCI,所以一個碼框就會有30個位元的 TFCI,編碼後表示此碼框的展頻因數,以供DPDCH 解展頻使用。表2.2列出DPDCH 相對應的展頻因數,位元數、傳輸速率等參數。DPCCH的SF是固定為256,所以一 個時槽只有10個位元,一個碼框150個位元。

## 2.5.2 上鏈共用頻道

主要的上鏈共用實體頻道為實體隨機擷取頻道(PRACH),被使用來攜帶傳輸頻道 RACH的訊息,其傳輸架構如圖2.4(a)所示。此頻道包含有一到多個長度為4096 切片的前序碼(preambles)和長度為10或是20 ms的訊息部分。

| Slot      | Channel  | Channel     | SF  | Bits/ | Bits/ | N <sub>data</sub> |
|-----------|----------|-------------|-----|-------|-------|-------------------|
| Format #k | Bit Rate | Symbol Rate |     | Frame | Slot  |                   |
|           | (kbps)   | (k sps)     |     |       |       |                   |
| 0         | 15       | 15          | 256 | 150   | 10    | 10                |
| 1         | 30       | 30          | 128 | 300   | 20    | 20                |
| 2         | 60       | 60          | 64  | 600   | 40    | 40                |
| 3         | 120      | 120         | 32  | 1200  | 80    | 80                |
| 4         | 240      | 240         | 16  | 2400  | 160   | 160               |
| 5         | 480      | 480         | 8   | 4800  | 320   | 320               |
| 6         | 960      | 960         | 4   | 9600  | 640   | 640               |

表2.2 DPDCH 不同k 相對應參數表

| Slot<br>Form<br>at # i | Channel<br>Bit Rate<br>(Kbps) | Channel<br>Symbol<br>Rate(Ksps) | SF  | Bits/Frame | Bits/Slot | N <sub>pilot</sub> | N <sub>TPC</sub> | N <sub>TFCI</sub> | N <sub>FBI</sub> | Transmitted<br>Slots per<br>Radio frame |
|------------------------|-------------------------------|---------------------------------|-----|------------|-----------|--------------------|------------------|-------------------|------------------|-----------------------------------------|
| 0                      | 15                            | 15                              | 256 | 150        | 10        | 6                  | 2                | 2                 | 0                | 15                                      |
| 0A                     | 15                            | 15                              | 256 | 150        | 10        | 5                  | 2                | 3                 | 0                | 10-14                                   |
| 0B                     | 15                            | 15                              | 256 | 150        | 10        | 4                  | 2                | 4                 | 0                | 8-9                                     |
| 1                      | 15                            | 15                              | 256 | 150        | 10        | 8                  | 2                | 0                 | 0                | 8-15                                    |
| 2                      | 15                            | 15                              | 256 | 150        | 10        | 5                  | 2                | 2                 | 1                | 15                                      |
| 2A                     | 15                            | 15                              | 256 | 150        | 10        | 4                  | 2                | 3                 | 1                | 10-14                                   |
| 2B                     | 15                            | 15                              | 256 | 150        | 10        | 3                  | 2                | 4                 | 1                | 8-9                                     |
| 3                      | 15                            | 15                              | 256 | 150        | 10        | 7                  | 2                | 0                 | 1                | 8-15                                    |
| 4                      | 15                            | 15                              | 256 | 150        | 10        | 6                  | 2                | 0                 | 2                | 8-15                                    |
| 5                      | 15                            | 15                              | 256 | 150        | 10        | 5                  | 1                | 2                 | 2                | 15                                      |
| 5A                     | 15                            | 15                              | 256 | 150        | 10        | 4                  | 1                | 3                 | 2                | 10-14                                   |
| 5B                     | 15                            | 15                              | 256 | 150        | 10        | 3                  | 1                | 4                 | 2                | 8-9                                     |

表 2.3 DPCCH 格式表



圖2.4 (a) 隨機擷取傳輸架構 (b) 前序碼(preambles)架構

## 2.6 展頻與調變

WCDMA利用兩層的碼架構,包含通道碼,及隨機攪亂碼(pseudo-random scrambling codes)。首先將每一資料記號(data symbol)乘上通道碼轉換成一定 數目的切片,因此增加了訊號的頻寬,達成展頻的效果,此通道碼是區分不同頻 道所使用,使用不同的展頻因數也可達成正交的功能,所以不同傳輸速率的兩頻 道也會達成正交,此通道碼會在2.6.1詳細介紹。攪亂碼是被使用來區分基地站 (下鏈),或是使用者間的區分(上鏈),上鏈攪亂碼的產生在2.6.2中詳細介紹。

## 2.6.1 通道碼(channelization codes)

系統中的通道碼是採用正交可變展頻因數(orthogonal variable spreading factor; OVSF)碼,它能保持不同長度間的碼正交性。此碼的產生可由圖2.5的碼 樹定義之。OVSF 碼可用C<sub>SF,k</sub> 來描述,其中SF 為該實體頻道所使用的展頻因 數, k 為碼數(code number),所以k 的範圍是從1到SF。在WCDMA系統中通道碼 是用來正交區分不同實體頻道。通道碼也可由以下數學表示式產生。

$$\begin{split} C_{1,1} &= 1 \\ & \left[ \begin{array}{c} C_{2,1} \\ C_{2,2} \end{array} \right] = \left[ \begin{array}{c} C_{1,1} \\ C_{2,1} \\ C_{2,1} \\ C_{2,1} \\ C_{2,1} \\ C_{2,2} \\ C_{2$$

是 $C_{\scriptscriptstyle n,SF,k}$ ,其規則是k=1當 $n \in \{1,2\}$ 、k=3當 $n \in \{3,4\}$ 、k=2當 $n \in \{5,6\}$ 。



圖 2.5 OVSF code 樹狀圖

# 2.6.2 上鏈攪亂碼(uplink scrambling code)

上鏈長攪亂碼是複數碼,是由兩個實數序列組合而成,此兩實數序列均是黃 金碼(Gold Code),由兩個二進位m-序列(m-sequence),X、Y序列以模數2(modulo 2)產生。此兩m-序列的生成多項式(generate polynomial)如下:

**X**序列:  $X^{25} + X^3 + 1$ 

**¥**序列:  $Y^{25} + Y^3 + Y^2 + Y + 1$ 

圖2.6 表示此長攪亂碼的生成構型圖, C<sub>long,1</sub>為實數部分, C<sub>long,2</sub>為虛數部分, 最後整體複數長攪亂碼定義為:

 $C_{long,n}(i) = C_{long,1,n}(i)^* (1 + j(-1)^i) C_{long,2,n}(2|i/2|)$ 

 $i = 0, 1, \dots, 2^{25} - 2$ 、定義為四捨五入的符號。而第n 個**DPDCH**上鏈 攪亂碼定義:  $S_{doch,n}(i) = C_{long,n}(i)$  for  $i = 0, 1, \dots, 38399$ 。



圖2.6 上鏈擾亂碼產生器

## 2.6.3 展頻與調變架構

圖2.7為上鏈實體專用頻道展頻方塊圖,此內部的每一展頻碼都已在上兩小節簡單介紹過,資料經過通道碼展頻後,緊接著會再乘上增益係數,控制頻道乘 b<sub>c</sub>,訊息頻道乘 b<sub>d</sub>,且至少要有一係數為1,此係數可用4 個位元劃分成16等級, 最後將1和Q通道相加之後再乘上攪亂碼 S<sub>dpch,n</sub>(i)。當然也不是所有的情況都是傳 送六條DPDCH,可傳送1、2、4、6條DPDCH,當要求較高的傳輸速率下才會一次傳 送多條DPDCH。圖2.8為上鏈實體頻道調變方塊圖,調變切片速率為3.84 Mcps,採用QPSK的調變方式,pulse shaping filter為平方根上升餘弦濾波器 (SRRC)。



圖2.8 上鏈調變圖

# 第三章 多使用者偵測技術簡介

## 3.1 直接序列分碼多工(DS-CDMA) 簡介

直接序列分碼多工是近年來相當受到矚目的通訊多工技術之一。與FDMA, TDMA 不同之處,使用戶各自被分配一組不同的碼,在系統中,所有用戶可以同 時被傳送,每個用戶也被分配一個完整頻段來傳送資料。DS-CDMA 發射機將使用 戶的信號與被分配的展頻碼相乘,而接收機的偵測器同時接收了所有使用戶的信 號,因此所有使用戶的信號在時域和頻域上互相重疊,產生了相互間的干擾。傳 統上,DS-CDMA偵測器依據單一用戶偵測的模式,其方法為針對個別的用戶信號 偵測而不考慮其他的用戶信號。這樣的偵測方式在使用戶不多的情況還不會發生 問題, 但隨著系統使用戶增加,使用戶之間的多重接收干擾(Multiple Access Interference)會越來越嚴重,發生偵測錯誤的機率就大大提高了。而現今較佳 的偵測方式為多用戶偵測,其原理為考慮其他使用戶的資訊來提升個別用戶的偵 測。

## 3.1.1 DS-CDMA 架構介紹 3

吾人首先介紹DS-CDMA系統的技術,如圖3.1。每個使用者都有一組展頻碼,表示如下:

$$a(t) = \frac{1}{N} \sum_{i=-\infty}^{\infty} a(i) P_{T_c}(t - iT_c)$$
(3.1)

$$P_{T_c}(t) = \begin{cases} 1 & 0 < t < T_c \\ 0 & otherwise \end{cases}$$
(3.2)

其中 $a(i) \in (+1,-1)$ ,  $T_c$ 是展頻碼的持續時間,  $T_b$ 是一個資料位元的持續時間。吾人定義 N 為處理增益 (processing gain: PG):  $T_b/T_c$ 。在這裡吾人假設資料是經過BPSK的調變方式傳送出去,表示如下:

$$d(t) = \sum_{i=-\infty}^{\infty} d(i) P_{T_b}(t - iT_b)$$
(3.3)

$$s(t) = \sqrt{2P} \sum_{i=-\infty}^{\infty} d(t)a(t)\cos(w_c t + q)$$
(3.4)

其中 $d(i) \in (-1, +1)$ 是資料位元序列,P是傳送信號的功率, $w_c$ 和q是接收時載 波頻率跟載波的相位。接收到的信號可以表示如下:

$$r(t) = s(t-t) + n(t)$$
 (3.5)

t 的範圍是 [0,T<sub>b</sub>) 是信號傳送延遲的時間, n(t) 代表白色可加性的高斯雜訊, 功率頻譜密度為 No/2。為了方便起見, 吾人假設載波相位為零, 經過解調變之後, 使用相關器 (correlator) 乘上展頻碼將資料作反展頻的動作, 得到如下的輸出:

$$\int_{iT_b+t}^{(i+1)T_b+t} a(t-t) d(t-t) d(t-t) dt$$
(3.6)

其中 $\boldsymbol{\delta}$ 是藉由同步程序估測出的通道延遲時間,由於 $a(t) \in [-1, +1]$ ,若 $\boldsymbol{\delta} = t$ ,則  $a(t-\boldsymbol{\delta})$  and a(t-t) 的值為 1,這就表示如果本地展頻碼跟傳送端的展頻碼相位同

步,則傳送的信號可以被正確的偵測,同步的程序將在下個章節介紹。



(a) (b)

圖3.1 DS-CDMA系統(a)傳送機(b)接收機

## 3.1.2 DS-CDMA 同步方法

通常在 DS-CDMA 的同步可以由[2]中的 Two-step 方法來解決。

- U 碼擷取(粗略的同步):將所接收的信號與本來的信號調整到偏差在+T<sub>c</sub>~-T<sub>c</sub> 之間。
- U 碼追蹤(精確的同步):將所接收的信號與本來的信號調整到偏差在一個切片時間的小部分之內。

圖3.2是基本的同步系統。在這個系統中,進入的信號使用撷取電路來粗略 的與本地碼(local code)作同步,接著再使用追蹤電路作更精確的同步。碼追蹤 的動作通常可以用noncoherent delay locked loop(DLL)來完成,其包含一個 early correlator 跟一個 late correlator。圖3.3即noncoherent DLL的架構 圖。early correlator 使用一個早0.5的切片時間的local code,而late correlator使用一個晚0.5切片時間的local code。

首先,進入的信號分別跟early local code跟late local code作correlation 的動作,得到的結果再經過Integrated and dumped

detector作integrate和dump的動作,然後經過Square-law envelope detector, 得到 $R_E^2(t)$ 跟 $R_L^2(t)$ 將兩個相減即可用來調整時間偏差。在此可定義一個誤差信 號e(t):

$$e(t) = R_L^2(t) - R_E^2(t)$$
 (3.7)

圖3.4即e(t)對t的函數圖,稱之為S-curve。這個信號可以用來驅動 voltage control oscillator(VCO)。根據這個誤差信號,VCO可以調整local clock使得 t = t。若 $e(\tau) > 0$ ,則表示local code相對於進入的信號有延遲的現象,因此會 驅動VCO使clock變快,反之則變慢。



圖3.2. 同步系統功能方塊圖



圖3.3.非同調delay-locked loop



# 3.1.3 傳統偵測器(conventional detector)

考慮一個有K個使用者的DS-CDMA系統,K個使用者非同步傳送給同一個接收 端,為了簡化討論,在此吾人假設載波的相位為零,也沒有多重路徑效應,每個 使用者都是經由單一路徑傳送到接收端,調變方式為BPSK,且在此只討論基頻信 號,第k個使用者傳送的信號如下:

$$s_k(t) = \sqrt{P_k} \sum_{i=-\infty}^{\infty} d_k(t) a_k(t)$$
(3.8)

接收的信號如下:

$$r(t) = \sum_{k=1}^{K} s_k (t - t_k) + n(t)$$
(3.9)

且 $a_k(t)$ 和 $d_k(t)$ 表示如下:

$$d_{k}(t) = \sum_{i=-\infty}^{\infty} d_{k}(i) P_{T_{b}}(t - iT_{b})$$
(3.10)

$$a_{k}(t) = \frac{1}{N} \sum_{i=-\infty}^{\infty} a_{k}(i) P_{T_{c}}(t - iT_{c})$$
(3.11)

$$P_{T_{c}}(t) = \begin{cases} 1 & 0 < t < T_{c} \\ 0 & otherwise \end{cases}$$
(3.12)

其中 $t_k$ 是第k 個使用者傳送信號的通道延遲時間, $T_c$ 是展頻碼的持續時間, $T_c$ 是 一個資料位元的持續時間。N 為處理增益(processing gain),前面已經定義過。 n(t)是可加性白色高斯雜訊,功率頻譜密度為 $No/2 \circ a_k(i) \in (+1,-1)$ 、  $d_k(i) \in (-1,+1)$ ,個別代表在第k 個使用者的展頻碼序列和資料序列。圖3.5是 傳統的偵測器。吾人從圖3.5可以很明顯的看到每個使用者偵測自己的信號,而 沒有顧慮到其他使用者信號同時存在,各個使用者展頻碼的互相關值對於這種偵 測器的效能影響非常大,當各個使用者展頻碼的互相關值小的時候會有較好的效 能;相對的,當互相關值大的時候效能較差。接收的信號經過第k 個使用者的相 關器的第i 個位元決策如下:

$$Z_{k}(i) = \frac{1}{T} \int_{(i-1)T+t_{k}}^{iT+t_{k}} r(t)a_{k}(t-t_{k})dt$$

$$= \sqrt{P_{k}}d_{k}(i) + \frac{1}{T} \int_{(i-1)T+t_{k}}^{iT+t_{k}} \sum_{\substack{j=1\\j\neq k}}^{K} \sqrt{P_{j}}d_{j}(t-t_{j})a_{j}(t-t_{j})a_{k}(t-t_{k})dt$$

$$+ \frac{1}{T} \int_{(i-1)T_{k}+t_{k}}^{iT_{k}+t_{k}} n(t)a_{k}(t-t_{k})dt$$
(3.13)

在(3.13)中, Z<sub>k</sub>(i)可分為三部分: 第一部分是第k 個使用者想接收的信號, 第二部分是 MI, 第三部分是雜訊跟展頻碼的關聯值。最後偵測出來的資料位元如下:

$$\hat{d}_{k}(i) = \operatorname{sgn}(Z_{k}(i))$$
 (3.14)

通常設計展頻碼時,會設計讓各個使用者展頻碼之間的關聯值很小,所以彼 此之間的干擾就會變小。然而,當干擾的使用者數目越來越多時,MAI的值會隨 著增加,而使得傳統的接收機的效能變差和系統的容量變小。在大多數的情況 下,就算使用者數目沒有特別大,MAI對系統的效能影響也很大,這是因為有的 使用者信號功率比較大,這也就是所謂的遠近效應(near-far effect)。



圖3.5 傳統接收機偵測器

# E ESA

# 3.2 多重使用者偵測器

近年來有許多多重使用者偵測方法被提出,可分為最佳的偵測器或者次佳的 偵測器[14,15,16]。次佳的偵測器又可大致分為線性偵測器、干擾消除偵測器。 在下面的章節中,吾人將會簡略的介紹這些偵測器。

# 3.2.1 最佳偵測器

Verdu 提出並分析最佳的多使用者偵測器[4],是一種 maximum likelihood 的偵測器。其目的在於得到使條件機率 P(d|r(t))最大的序列  $\hat{d}$ ,也就是最後得 到的資料位元,而  $s_k(t)$ 是第k 個使用者傳送的信號,r(t)是接收端接收的信號, 這些都跟前面章節的定義一樣。若我們假設所有使用者傳送的序列的機率是一樣 的。**ML** 決策式子如下:

$$\begin{split} \mathbf{\underline{A}}^{*}_{ML} \in & \arg \left\{ \min_{\underline{\mathbf{d}} \in \{-1,+1\}^{k}} \int_{0}^{T} \left[ r(t) - \sum_{k=1}^{K} s_{k}(t) \right]^{2} dt \right\} \\ &= \arg \left\{ \max_{\underline{\mathbf{d}} \in \{-1,+1\}^{k}} \left[ 2 \underline{\mathbf{y}}^{T} \underline{\mathbf{d}} - \underline{\mathbf{d}}^{T} \mathbf{R} \underline{\mathbf{d}} \right] \right\} \end{split}$$
(3.15)

其中R是個nonnegative definite的矩陣,是由所有使用者展頻碼組成的相關係 數矩陣, d 是使用者傳送的資料組成的向量, y 是傳統的偵測器的輸出組成的向 量。由式子(3.15)來看,有2KN(K是使用者數目,N是訊息長度)個可能的路徑。 為了減少計算的複雜度,可以使用Viterbi algorithm。雖然這個偵測器是有最 佳的效能跟容量,但是隨使用者數目增加,計算的複雜度呈現指數性的增加。在 實際的DS-CDMA系統裡,有相當大活動中的使用者數目,所以ML偵測器是不實際 並且難以實現的。

#### ATTILLES .

# 3.2.2. 解相關偵測器(de-correlating detector)

此種偵測器在傳統的接收機的輸出組成的向量y作線性的轉換乘上一矩陣 L來消除掉MAI和遠近效應。式子如下: 且=sgn[Ly] (3.16)

其中矩陣L是展頻碼相關矩陣R的反矩陣,所以(3.16)變成如下:

$$\underline{\mathbf{d}}_{dec} = \operatorname{sgn}\left[\mathbf{R}^{-1}\underline{\mathbf{y}}\right] = \operatorname{sgn}\left[\underline{\mathbf{d}} + \mathbf{R}^{-1}\underline{\mathbf{n}}\right]$$
(3.17)

相較於最佳偵測器,解相關偵測器每個位元的計算複雜度隨的使用者的數目呈現線性增加,而且不需要去估測接收到的信號的振幅。從式子(3.17)可以看出解相關偵測器可以完全消除MAI的影響,可是卻放大了雜訊,R<sup>-1</sup>n即放大的雜訊。然而此種偵測器雖然大大的改善傳統偵測器的效能,可是反矩陣的運算難以在即時性的系統上實現,而且矩陣R不一定都是invertible的。

## 3.2.3 最小均方差偵測器(MMSE detector)

解相關偵測器有放大雜訊的缺點,而最小均方差偵測器則將雜訊列入考慮。 其方法即使得傳送的信號跟傳統接收器的輸出<u>y</u>之間的均方差有最小值而得到 一轉換矩陣L<sub>MMSE</sub>如下:

$$\mathbf{L}_{MMSE} = [\mathbf{R} + (No/2)]^{-1}$$
 (3.18)

其中R定義成用戶展頻碼間的相關係數矩陣,No/2為雜訊的功率頻譜密度。從 (3.18)可以看出當沒有雜訊時,最小均方差偵測器等效於解相關偵測器。最後的 位元決策可由下式得到:

$$\underline{\mathbf{\delta}}_{MMSE} = \operatorname{sgn}\left[\mathbf{L}_{MMSE}\,\underline{\mathbf{y}}\right] \tag{3.19}$$

它的性能在 SNR 高時和多路徑解相關偵測器相近,當 SNR 降低時,性能則接近於傳統的匹配濾波器。最小均方差偵測器與上述解相關偵測器皆有同樣作反矩陣運算的缺點,難以在即時性的系統上實現。

# 3.2.4 連續干擾消除(SIC)

干擾消除是一種常被使用的多重使用者偵測技術。基本的原則是估測、重新 製造、消除不想要的信號干擾。用來估測 MAI 的 Bit decision 可以是 hard decision 或者是 soft decision。當無法有可靠的 MAI 估測時使用 soft decision 會比 hard decision 表現來的好。不管如何,如果 MAI 估測不正確的時候,反而 會產生第二次的干擾,會使原有的效能更加降低。

在 SIC 技術中, 恰如其名, 估測消除的步驟是連續性的進行[17]。 首先, 所有的使用者收到的信號按照其功率大小重新排列,接著只消除掉功率最強的信 號。接著再將次強的信號消除掉,接著是第三強的,依此類推,直到最弱的信號 消除掉為止。圖 3.5 即為 SIC 的架構圖。

使用 SIC 需要較低的硬體複雜度而且效能的改進也非常大。然而有以下兩缺點:

- 1. 相當大的處理時間延遲
- 2. 當收到的信號的功率強度順序改變時要重新排定順序



相較於 SIC, PIC 是以平行的方法估測以及消除所有的 MAI,因此不需要按照信號功率強度重新排列順序,所以沒有處理時間延遲的問題,而且計算複雜度 只隨著使用者數目呈現線性成長,而非指數性成長。與 SIC 相較之下,更適合硬 體實現。

PIC 偵測器可以被設計成多級的架構,多級疊代方法是由 Varanasi and Aazhang 所提出的[18]。每一級使用上一級所估測的決策來做為輸入的資料,再 產生新的估測。圖 3.7 即 PIC 偵測器的架構圖。在第一級中,由傳統的相關器 (correlator)得到所有使用者資料的暫時性決策(tentative decision),接著 在第二級中使用這些暫時性決策來估測 MAI 並進行消除的動作。第二級所得到的 decision static  $Z_k^{(2)}(i)$ 可以表示如下:

$$\hat{s}_{k}(t-t_{k}) = a_{k}(t-t_{k}) \sum_{i=-\infty}^{\infty} Z_{k}^{(1)}(i) P_{T_{b}}(t-iT_{b}-t_{k})$$
(3.20)

$$\hat{r}_{k}(t) = r(t) - \sum_{\substack{j=1\\j \neq k}}^{K} \hat{s}_{j}(t - t_{k})$$
(3.21)

$$Z_{k}^{(2)}(i) = \int_{(i-1)T_{b}+t_{k}}^{iT_{b}+t_{k}} \hat{r}_{k}(t) a_{k}(t-t_{k}) dt$$
(3.22)

其中 $Z_k^{(1)}(i)$ 是在第一級的相關器的輸出。 $\hat{s}_k(t)$ 是使用相關器輸出重新產生的第k個使用者的信號。 $\hat{s}_k(t)$ 則是消除掉**胍** 之後的第k個使用者收到的訊號。

依據不正確的估測來做干擾消除的動作,將會造成二次干擾。因此,若一開始的大多數決策是錯誤的,則PIC 的效能將會低於傳統偵測器。為了克服這個問題,我們可以在估測的 MAI 乘上一個小於 1 的係數[19],這種類型的 PIC 偵測器稱之為部分平行干擾消除 (Partial PIC),而此係數稱之為部分消除因子 (partial cancellation factor),簡稱為 PCF。圖 3.8 即 Partial PIC 的架構 圖。隨著估測的可靠性的增加,PCF 的值也會隨著層級而增加。

在圖 3.8 中,每個使用者必須消除掉其他 K-1 個的使用者的干擾,隨者使用 者數目的增加,計算複雜度是呈現平方性的增加。而在[8]中提出了一種理論上 等效的方法將計算複雜度隨著使用者數目呈線性增加,其架構圖如 3.9 所示。



圖3.7二級平行千擾消除偵測器架構圖



圖3.8二級partial PIC 偵測器架構圖



圖3.9 二級低複雜度partial PIC 偵測器架構圖

# 第四章 MMSE Partial PIC 偵測器在 WCDMA

# 系統上的應用

Partial PIC 偵測器是一種廣為使用來消除多重接收干擾跟遠近效應的偵測器。在這種偵測器中,PCF 值是一個很重要的係數。在本章中,將提出三種使用 PCF 的 MMSE patial PIC 偵測器,並作模擬驗證其在 WCDMA 應用之可行性。

## 4.1 系統架構

首先以複數展頻 CDMA 系統作為我們的系統架構。在這裡我們不考慮多重路 徑效應只考慮有可加性的白色高斯雜訊(AMGN)。接收端所接收的信號如下:

$$r(t) = \sum_{k=1} \sqrt{P_k} \left( d_{k,I}(t - t_k) + j \times d_{k,Q}(t - t_k) \right) \left( a_{k,I}(t - t_k) + j \times a_{k,Q}(t - t_k) \right) + n(t - t_k)$$
(4.1)

$$a_{k}(m) = a_{k,I}(m) + j \times a_{k,Q}(m) \qquad a_{k}(t) = \sum_{m=-\infty}^{\infty} a_{k}(m) P_{T_{c}}(t - mT_{c}) \qquad (4.2)$$

$$d_{k}(i) = d_{k,I}(i) + j \times d_{k,Q}(i) \qquad d_{k}(t) = \sum_{i=-\infty}^{\infty} d_{k}(i)P_{T_{b},k}(t-iT_{b,k})$$
(4.3)

其中 $P_{T_c}(t)$  和 $P_{T_{b,k}}(t)$  在前面的章節已經提過, $T_c$ 是切片時間(Chip time), $T_{b,k}$ 是 第k 個使用者的位元持續時間, $d_{k,l}$ 和 $d_{k,o}$ 是第k 個使用者  $I \ Q$  通道傳送的資料

位元, $a_{k,I}$ 和 $a_{k,Q}$ 是第k個使用者展頻碼的虛部和實部, $t_k \in (0,T_b]$ 是第k個使用者的通道延遲時間,n(t)是可加白色高斯雜訊,其自相關函數為

$$\begin{split} E[n(t)n^{*}(t)] &= \frac{N_{0}}{2} d(t-t) \circ d_{k,I}, d_{k,Q}, a_{k,I}, a_{k,Q} \in \{-1,+1\}, \text{ 出現+1 和-1 的機率相等 } \\ m 代表 m T_{c} 的時間點, i 代表 i T_{b,k} 的時間點 \circ \Diamond N_{k} = \frac{T_{b,k}}{T_{c}}, \text{ 是第 } k 個使用者的 PG, \\ 则 m 和 i 有以下的關係: \end{split}$$

$$m = iN_{\nu} + n \tag{4.4}$$

其中*n*是整數且*n*∈(0,*N*−1)。由(4.4)可知*i*=
$$\left\lfloor \frac{m}{N_k} \right\rfloor$$
,所以(4.3)可以表示如下:

$$d_{k}\left(\frac{m}{N_{k}}\right) = d_{k,I}\left(\frac{m}{N_{k}}\right) + j \times d_{k,Q}\left(\frac{m}{N_{k}}\right) \qquad d_{k}(t) = \sum_{m=-\infty}^{\infty} d_{k}\left(\frac{m}{N_{k}}\right) P_{T_{b},k}\left(t - \left\lfloor\frac{m}{N_{k}}\right\rfloor T_{b,k}\right) \quad \textbf{(4.5)}$$

$$= A \land \forall m_{k} = \left\lfloor\frac{m}{N_{k}}\right\rfloor \textbf{P}\left(\textbf{(4.5)}, \textbf{(4.5)}, \textbf{(4.5)}\right) = \frac{m}{N_{k}} \left\lfloor\frac{m}{N_{k}}\right\rfloor P_{T_{b},k}\left(t - \left\lfloor\frac{m}{N_{k}}\right\rfloor T_{b,k}\right) \quad \textbf{(4.5)}$$

 $d_{k}(m_{k}) = d_{k,I}(m_{k}) + j \times d_{k,Q}(m_{k}) \qquad d_{k}(t) = \sum_{m=-\infty}^{\infty} d_{k}(m_{k}) P_{T_{b},k}\left(t - m_{k}T_{b,k}\right)$ (4.6)

參考[7], 吾人可知同步的 PIC 偵測器的效能比非同步的差。這是因為在同步系統中隨機展頻碼的互相關函數比在非同步系統中的大[20,21]。而一個同步的系統使用非週期性之展頻碼也可以視為非同步系統。因此,在不失一般性之下, 吾人只討論在同步系統中 PCF 的值。

在大多數的研究中,PCF 值對單一使用者在一個位元時間內都是固定的 [19,8]。換句話說,一個使用者使用一樣的 PCF 值來消除其他使用者造成的干 擾,使得最後的效能變的更好。但是在大多數的情形中,使用者展頻碼之間的互 相關函數是不一樣的。因此上一級估測的可信度可能是不一樣的。在吾人所提出 的架構,PCF 的值是根據使用者所受到的多重接收干擾大小而決定的。在以下的 章節將會介紹。

## 4.2 MMSE Partial PIC 偵測器

在本節中, 吾人介紹兩種偵測器的, 分別是 deterministic MMSE Partial PIC 偵測器和 random MMSE Partial PIC 偵測器。前者每個使用者的展頻碼是固定的, 而後者則將每個使用者的展頻碼視為隨機變數, 因而有不同的 PCF 推導結果, 在 4.2.1 和 4.2.2 將會詳細介紹。

#### 4.2.1 Deterministic MMSE Partial PIC 偵測器

吾人假設通道延遲可以被被正確的估測,所以在此暫不考慮。此系統的傳送架 構圖如下圖 4.1。

![](_page_33_Figure_0.jpeg)

圖 4.1 複數展頻 CDMA 系統架構

此系統有 K 個使用者,各個使用者可以有不一樣的 PG 為 N<sub>k</sub>,則接收到的取樣信號如下:

$$r(mT_c) = \sum_{k=1}^{K} \sqrt{P_k} d_k(mT_c) a_k(mT_c) + n(mT_c)$$
 (4.7)

為了式子簡潔起見,在第m個切片時間mT<sub>c</sub>,簡略寫為m(下面所有式子都是如此省略),所以上式可以表示如下; 1896

$$r(m) = \sum_{k=1}^{K} \sqrt{P_k} d_k(m) a_k(m) + n(m)$$
 (4.8)

經過第一級的第*k* 個使用者的相關器(correlator)之後的第*i* 個位元的決策輸出 如下:

$$Z_{k}^{(1)}(i) = \frac{1}{2N_{k}} \sum_{m=iN_{k}}^{(i+1)N_{k}-1} r(m) a_{k}^{*}(m)$$
  
=  $\sqrt{P_{k}} d_{k}(i) + \frac{1}{2N_{k}} \sum_{\substack{j=1\\j\neq k}}^{K} \sum_{m=iN_{k}}^{(i+1)N_{k}-1} \sqrt{P_{j}} d_{j}(m_{j}) a_{j}(m) a_{k}^{*}(m) + \frac{1}{2N_{k}} \sum_{m=iN_{k}}^{(i+1)N_{k}-1} n(m) a_{k}^{*}(m)$   
(4.9)

且

$$a_k(m) = a_{k,I}(m) + j \times a_{k,Q}(m)$$
 (4.10)

$$d_k(i) = d_k(m_k) = d_{k,l}(m_k) + j \times d_{k,0}(m_k)$$
(4.11)

其中 1 2N<sub>k</sub> 是正規化因數, 第一部分是我們想要的第*k* 個使用者的信號, 而第二部 分則是 **MI**, 第三部分則是雜訊的干擾。

吾人使用第一級的相關器的輸出**(4.9)**式來重新產生 $\hat{S}_{j}(m)$ 如下:

$$\hat{S}_{j}(m) = a_{j}(m)Z_{j}^{(1)}(m_{j})$$
 (4.12)

將其他 $\hat{S}_{j}(m)$ 相加並乘上 **PCF** 值之後,再從收到的信號將其扣除掉而得到如下的 第k 個使用者重建的信號:

$$\mathbf{\hat{S}}_{k}(m) = r(m) - C_{k} \sum_{\substack{j=1 \ j \neq k}}^{2} S_{j}(m)$$
 (4.13)

再將 $\boldsymbol{\beta}_k(m)$ 經過第二級第k個使用者的相關器得到的第i個位元的決策輸出如

$$\begin{aligned} \mathbf{F} : \\ Z_{k}^{(2)}(i) &= \frac{1}{2N_{k}} \sum_{m=iN_{k}}^{m=(i+1)N_{k}-1} \hat{r}_{k}(m) a_{k}^{*}(m) \\ &= \frac{1}{2N_{k}} \sum_{m=iN_{k}}^{m=(i+1)N_{k}-1} (r(m) - C_{k} \sum_{j=1}^{K} S_{j}(m)) a_{k}^{*}(m) \\ &= Z_{k}^{(1)}(i) - \frac{C_{k}}{2N_{k}} \sum_{j=1}^{K} \sum_{m=iN_{k}}^{m=(i+1)N_{k}-1} \left( a_{j}(m) Z_{j}^{(0)}(m_{j}) \right) a_{k}^{*}(m) \\ &= d_{k}(i) \sqrt{P_{k}} + \frac{1}{2N_{k}} \sum_{j=1}^{K} \sum_{m=iN_{k}}^{m=(i+1)N_{k}-1} \sqrt{P_{j}} d_{j}(m_{j}) a_{j}(m) a_{k}^{*}(m) \\ &+ \frac{1}{2N_{k}} \sum_{m=iN_{k}}^{(i+1)N_{k}-1} n(m) a_{k}^{*}(m) - \frac{C_{k}}{2N_{k}} \left[ \sum_{j=1}^{K} \sum_{m=iN_{k}}^{m=(i+1)N_{k}-1} d_{j}(m_{j}) \sqrt{P_{j}} a_{j}(m) a_{k}^{*}(m) \\ &+ \sum_{j=1}^{K} \frac{1}{2N_{j}} \sum_{m=i}^{K} \sum_{m=iN_{k}}^{m=(i+1)N_{k}-1} a_{j}(m) a_{k}^{*}(m) \sum_{n=m_{j}N_{j}}^{n=(m_{j}+1)N_{j}-1} \sqrt{P_{p}} d_{p}(m_{p}) a_{p}(n) a_{j}^{*}(n) \\ &+ \sum_{j=1}^{K} \frac{1}{2N_{j}} \sum_{m=iN_{k}}^{K} \sum_{m=iN_{k}}^{m=(i+1)N_{k}-1} a_{j}(m) a_{k}^{*}(m) \sum_{n=m_{j}N_{j}}^{n=(m_{j}+1)N_{j}-1} n(n) a_{j}^{*}(n) \right] \end{aligned}$$

最後吾人可以藉由(4.15)式子得到最後輸出位元:

$$\hat{d}_k(i) = \operatorname{sgn}\left[\operatorname{Re}(Z_k^{(2)}(i))\right] + j \cdot \operatorname{sgn}\left[\operatorname{Img}(Z_k^{(2)}(i))\right]$$
(4.15)

吾人定義以下符號:

 $A_{j,k}(m) = a_j(m)a_k^*(m)$  (4.16)

$$N_{j,k} = \min(N_j, N_k)$$
(4.17)

$$\left\lfloor \frac{m}{N_{j,k}} \right\rfloor = m_{j,k} \tag{4.18}$$

則吾人可以得到信號誤差如下:

$$e_{k}(i) = \sqrt{P_{k}}d_{k}(i) - Z_{k}^{(2)}(i)$$

$$= \frac{C_{k}}{2N_{k}} \left[ \sum_{\substack{j=1\\j\neq k}}^{K} \sum_{m=iN_{k}}^{m=(i+1)N_{k}-1} d_{j}(m_{j})\sqrt{P_{j}}a_{j}(m)a_{k}^{*}(m) + \sum_{j=1}^{K} \frac{1}{2N_{j}} \sum_{\substack{p=1\\p\neq j}}^{K} \sum_{m=iN_{k}}^{m=(i+1)N_{k}-1} a_{j}(m)a_{k}^{*}(m) \sum_{n=m_{j}N_{j}}^{n=(m_{j}+1)N_{j}-1} \sqrt{P_{p}}d_{p}(n_{p})a_{p}(n)a_{j}^{*}(n) + \sum_{\substack{j=1\\j\neq k}}^{K} \frac{1}{2N_{j}} \sum_{\substack{m=iN_{k}}}^{m=(i+1)N_{k}-1} a_{j}(m)a_{k}^{*}(m) \sum_{n=m_{j}N_{j}}^{n=(m_{j}+1)N_{j}-1} n(n)a_{j}^{*}(n) \right]$$

$$- \frac{1}{2N_{k}} \sum_{\substack{j=1\\j\neq k}}^{K} \frac{m=(i+1)N_{k}-1}{m=iN_{k}} \sqrt{P_{j}}d_{j}(m_{j}) a_{j}(m)a_{k}^{*}(m)$$

$$- \frac{1}{2N_{k}} \sum_{\substack{m=iN_{k}}}^{(i+1)N_{k}-1} n(m)a_{k}^{*}(m)$$
(4.19)

吾人假設 $\{d_{k,l}(i)\}$ 和 $\{d_{k,o}(i)\}$ 是隨機變數序列,其值為+1和-1的機率各為

**1/2**,且任意不同使用者和不同時間點的序列彼此是獨立的。則吾人根據(4.19) 可得到第*k* 個使用者的平均平方誤差(mean square error)如下:
為了讓式子看起來比較簡潔吾人之後的式子都將由每個式子下面的符號來 替代。要讓 $MSE_k$ 有最小值,吾人藉由對任意正整數k解 $\frac{\partial MSE_k}{\partial C_k} = 0$ ,可得到 **MMSE PCF** 的值如下:

$$C_{k} = \frac{B1 + B2 + B3}{2(A1 + A2 + A3 + A4)}$$
(4.21)

而要得到上式 MMSE PCF 的值, 吾人必須先知道每個使用者的信號功率、展頻碼 的互相關值(cross-correlations)、還有雜訊的功率、每個使用者的 PG。假使 有新的使用者加入此系統,或者現有的使用者離開,則互相關值會跟著改變,則 PCF 值也隨著改變,要重新計算 PCF 的值。吾人稱此種偵測器為 Deterministic MMSE Partial PIC 偵測器, 簡稱為 DMMSE 偵測器。

# 4.2.2 Random MMSE Partial PIC 偵測器

這個章節中, 吾人將介紹另外一種偵測器, Random MMSE Partial PIC 偵測器, 簡稱為 RMMSE 偵測器。跟 DMMSE 偵測器不一樣的地方為在此吾人假設第k 個使用 者的第m 個切片時間的展頻碼的實部和虛部  $\{a_{k,l}(m)\}$ 跟 $\{a_{k,Q}(m)\}$ 視為隨機變 數, 不同時間點和不同使用者之間彼此獨立, 出現+1和-1的機率各為 1/2。  $A_{j,k}(m) = a_j(m)^* a_k^*(m)$ , 則 $A_{j,k}(m)$ 的 probability density function (PDF) 值如 下:

$$\Pr\{A_{j,k}(m) = 2\} = 1/4, \Pr\{A_{j,k}(m) = -2\} = 1/4, \Pr\{A_{j,k}(m) = 2j\} = 1/4, \Pr\{A_{j,k}(m) = -2j\} = 1/4$$
(4.22)

吾人可以得到A<sub>i,k</sub>(m)的統計特性如下:

$$E[A_{j,k}(m)] = 0$$

$$E[A_{j,k}(m)A^{*}_{j,k}(m)] = 4$$

$$E[A_{j,k}(m)A^{*}_{j,k}(m)A_{j,k}(m)] = 0$$

$$E[A_{j,k}(m)A^{*}_{j,k}(m)A_{j,k}(m)A^{*}_{j,k}(m)] = 16$$

$$(4.23)$$

$$(4.24)$$

$$(4.25)$$

$$(4.26)$$

接著我們可以利用(4.23)~(4.26)子來推導出(4.27)~(4.29)的統計特性如下:

$$E\left[\sum_{m=iN_{k}}^{m=(i+1)N_{k}-1}A_{j,k}(m)\sum_{n=m_{k,j}N_{k,j}}^{n=(m_{k,j}+1)N_{k,j}-1}A_{j,k}^{*}(n)\right] = \begin{cases} 4N_{k} & \text{for } j \neq k\\ 4N_{k}^{2} & \text{for } j = k \end{cases}$$
(4.27)

$$E\left[\sum_{m=iN_{k}}^{m=(i+1)N_{k}-1}A_{l,k}(m)\sum_{m=iN_{k}}^{m=(i+1)N_{k}-1}A^{*}_{j,k}(m)\sum_{n=m_{l,j}N_{l,j}}^{n=(m_{l,j}+1)N_{l,j}-1}A^{*}_{j,l}(n)\right] = \begin{cases} 8N_{k}^{2}N_{j} & \text{for } j = k = l\\ 8N_{k} & \text{for } j \neq k \neq l \\ 8N_{k}N_{j} & \text{for } j = l \neq k \\ 0 & \text{others} \end{cases}$$
(4.28)

$$E\left[\sum_{m=iN_{k}}^{m=(i+1)N_{k}-1} A_{j,k}(m) \sum_{n=m_{j}N_{j}}^{n=(m_{j}+1)N_{j}-1} A_{p,j}^{*}(n) \sum_{m=iN_{k}}^{m=(i+1)N_{k}-1} A_{l,k}^{*}(m) \sum_{\hat{n}=n_{l,p}N_{l,p}}^{\hat{n}=(n_{l,p}+1)N_{l,p}-1} A_{p,l}^{*}(\hat{n})\right]$$

$$=\begin{cases} 16N_{k}(N_{k}-1) & for \quad j = l \neq k, \ p = k \\ 32N_{k}N_{j} & for \quad j = l \neq k, \ p \neq j \\ 16N_{k}(N_{k}-1) & for \quad j \neq l \neq k, \ p = k \\ 16N_{k} & for \quad j \neq l \neq k, \ p \neq j \neq l \\ 0 & others \end{cases}$$

$$(4.29)$$

利用(4.27)~(4.29)式子, 吾人可以將(4.20) 替换成下面的式子:

$$MSE_{k} = \left(\frac{C_{k}}{2N_{k}}\right)^{2} \left\{ \sum_{\substack{j=1\\j\neq k}}^{K} 8P_{j}N_{k} + \sum_{\substack{j=1\\j\neq k}}^{K} \sum_{\substack{j=1\\j\neq k}}^{K} \frac{16N_{k}P_{l}}{N_{j}} + \sum_{\substack{j=1\\j\neq k}}^{K} \sum_{\substack{j=1\\j\neq k}}^{K} \frac{8P_{k}N_{k}(N_{k}-1)}{N_{j}^{2}} + \sum_{\substack{j=1\\j\neq k}}^{K} \sum_{\substack{j=1\\j\neq k}}^{K} \sum_{\substack{j=1\\j\neq k}}^{K} \frac{8N_{k}P_{k}(N_{k}-1)}{N_{j}N_{l}} + \sum_{\substack{j=1\\j\neq k}}^{K} \frac{N_{k}N_{0}}{N_{j}} + \sum_{\substack{j=1\\j\neq k}}^{K} \frac{N_{k}N_{0}}{N_{j}} \right\} - \frac{C_{k}}{(2N_{k})^{2}} \left\{ \sum_{\substack{j=1\\j\neq k}}^{K} 16P_{j}N_{k} + \sum_{\substack{j=1\\j\neq k}}^{K} \sum_{\substack{j=1\\j\neq k}}^{K} \frac{16P_{i}N_{k}}{N_{j}} + \sum_{\substack{j=1\\j\neq k}}^{K} \frac{16P_{i}N_{k}}{N_{j}} + \sum_{\substack{j=1\\j\neq k}}^{K} \frac{2N_{k}N_{0}}{N_{j}} \right\} - \frac{C_{k}}{(2N_{k})^{2}} \left\{ \sum_{\substack{j=1\\j\neq k}}^{K} 16P_{j}N_{k} + \sum_{\substack{j=1\\j\neq k}}^{K} \sum_{\substack{j\neq k}}^{K} \frac{16P_{i}N_{k}}{N_{j}} + \sum_{\substack{j=1\\j\neq k}}^{K} \frac{2N_{k}N_{0}}{N_{j}} \right\}$$

$$(4.30)$$

同樣的,要讓 $MSE_k$ 有最小值,吾人藉由對任意正整數k 解 $\frac{\partial MSE_k}{\partial C_k} = 0$ ,可

得到 MMSE PCF 的值如下:

$$C_{k} = \frac{\sum_{\substack{j=1\\j\neq k}}^{K} [P_{j} + \sum_{\substack{l\neq k\neq j \ N_{j}}}^{K} \frac{2P_{l}}{N_{j}} + \frac{N_{0}}{8N_{j}}]}{\sum_{\substack{j=1\\j\neq k}}^{K} [P_{j} + \frac{P_{k}(N_{k}-1)}{N_{j}^{2}} + \frac{N_{0}}{8N_{j}} - \frac{P_{k}}{N_{j}}] + \sum_{\substack{j=1\\j\neq k}}^{K} \sum_{\substack{l=1\\l\neq j\neq k}}^{K} \frac{3P_{l}}{N_{j}} + \sum_{\substack{j=1\\j\neq k}}^{K} \sum_{\substack{l=1\\l\neq j\neq k}}^{K} \frac{P_{p}}{N_{j}N_{l}} + \sum_{\substack{j=1\\j\neq k}}^{K} \sum_{\substack{l=1\\l\neq j\neq k}}^{K} [\frac{P_{k}(N_{k}-1)}{N_{l}} + \frac{N_{0}}{8N_{j}}] + \sum_{\substack{j=1\\j\neq k}}^{K} \frac{3P_{l}}{N_{j}j\neq k} + \sum_{\substack{l=1\\l\neq j\neq k}}^{K} \sum_{\substack{p=1\\l\neq j\neq k}}^{K} \frac{P_{p}}{N_{j}N_{l}} + \sum_{\substack{l=1\\j\neq k}}^{K} [\frac{P_{k}(N_{k}-1)}{N_{l}} + \frac{N_{0}}{8N_{j}}] + \sum_{\substack{p=1\\j\neq k}}^{K} \frac{3P_{l}}{N_{j}j\neq k} + \sum_{\substack{p=1\\l\neq j\neq k}}^{K} \sum_{\substack{p=1\\l\neq j\neq k}}^{K} \frac{P_{p}}{N_{j}N_{l}} + \sum_{\substack{p=1\\j\neq k}}^{K} [\frac{P_{k}(N_{k}-1)}{N_{l}} + \frac{N_{0}}{8N_{j}}] + \sum_{\substack{p=1\\j\neq k}}^{K} \frac{3P_{l}}{N_{j}j\neq k} + \sum_{\substack{p=1\\l\neq j\neq k}}^{K} \frac{P_{p}}{N_{j}N_{l}} + \sum_{\substack{p=1\\l\neq j\neq k}}^{K} [\frac{P_{k}(N_{k}-1)}{N_{l}} + \frac{N_{0}}{8N_{j}}] + \sum_{\substack{p=1\\j\neq k}}^{K} \frac{3P_{l}}{N_{j}j\neq k} + \sum_{\substack{p=1\\l\neq j\neq k}}^{K} \frac{P_{p}}{N_{j}N_{l}} + \sum_{\substack{p=1\\l\neq k}}^{K} \frac{P_{p}}{N_{l}j\neq k} + \sum_{\substack{p$$

(4.31)所得到的 PCF 值,不需要知道每個使用者的展頻碼,只需要知道每個使用 者的功率以及其 PG 和雜訊的 PSD。當有新的使用者加入或者原有的使用者離開 時,很容易再重新計算 PCF 的值,吾人稱此種偵測器為 Random MMSE Partial PIC 偵測器,簡稱為 RMMSE 偵測器。假設若所有的使用者的 PG 都一樣為 N,則(4.31) 的結果變為:

$$C_{k} = \frac{N\left\{\sum_{\substack{m=1\\m\neq k}}^{K} P_{m}\left[N + \sum_{\substack{n=1\\n\neq m\neq k}}^{K} P_{n}\right] + \frac{N_{0}}{8}(K-1)\right\}}{P_{k}\left[(K-1)(KN-1)\right] + \sum_{\substack{m=1\\m\neq k}}^{K} P_{m}\left[N^{2} + (K-2)(3N+K-3)\right] + \sum_{\substack{m=1\\m\neq k}}^{K} \frac{N_{0}}{8}\left[K-2+N\right]}$$

# (4.32)

若所有的使用者的PG一樣為N且所有使用者信號的功率也一樣都為P則(4.31) 變成如下結果:

$$C_{k} = \frac{N\left\{P(K-1)(N+K-2) + \frac{N_{0}}{8}(K-1)\right\}}{P\left[(K-1)(KN-1)\right] + P(K-1)\left[N^{2} + (K-2)(3N+K-3)\right] + \frac{N_{0}}{8}(K-1)(K-2+N)}$$
(4.33)

參考**[22]**,若其假設所有的使用者的**PG**都一樣,最後得到的結果如下:  

$$C_{k} = \frac{N\left\{P(K-1)(N+K-2) + \frac{N_{0}}{8}(K-1)\right\}}{P[(K-1)(KN-1)] + P(K-1)\left[N^{2} + (K-2)(3N+K-3)\right] + \frac{N_{0}}{8}(K-1)(K-2+N)}$$
(4.34)

(4.34)跟(4.33)的結果是一樣的,證明吾人所推導的式子是正確的。圖4-2為MMSE Partial PIC偵測器的架構圖,DMMSE偵測器和RMMSE偵測器的架構圖都是一樣 的,只是計算 PCF的值的式子不一樣。



圖4.2 提出的MMSE Partial PIC偵測器架構圖

## 4.3 Sub-bit Random MMSE Partial PIC 偵測器

在4.2.1和4.2.2中提出的偵測器的架構,因為每個使用者的PG可能都不一樣,以WCDMA系統為例,DPDCH的PG範圍可以從4到256,如此一來,若用4.2.1和 4.2.2提出的架構,則必須要多出一些儲存單位來儲存經過關聯器之後的輸出, 此為第一種架構,雖然有較佳的效能但是卻增加硬體複雜度。若假設一個系統 內,其PG最小為N,吾人將每個相關器的長度都設計為N,則不需要再另外增加儲 存單位,此為第二種架構,雖然效能較差,但是可以減少硬體複雜度。下一段將 詳細介紹此種架構。

假設一個系統內PG最小為N,則吾人將各個使用者關聯器計算的長度 N<sub>k</sub> 改為 N。同樣的,接收到的信號經過第一級的第*k* 個使用者的相關器之後的第*i* 個次位 元(sub-bit)的決策輸出如下:

$$Z_{k}^{(1)}(i) = \sqrt{P_{k}} d_{k}(i) + \frac{1}{2N} \sum_{\substack{m=1\\m\neq k}}^{K} \sqrt{P_{m}} d_{m}(i) R_{mk} + \frac{h_{k}(i)}{2N}$$
(4.35)

而

$$R_{kj}(i) = \sum_{m=(i-1)N+1}^{iN} a_k(mT_c) a_j^*(mT_c)$$
(4.36)

$$h_{k}(i) = \sum_{m=(i-1)N+1}^{iN} n(mT_{c})a_{k}^{*}(mT_{c})$$
(4.37)

接著像4.2章節一樣重建各個使用者的信號,將重建的信號通過第二級的第k 個使用者的關聯器得到次位元決策如下;

$$Z_{k}^{(2)}(i) = \sqrt{P_{k}} d_{k}(i) + \frac{1}{2N} \sum_{\substack{m=1\\m\neq k}}^{K} \sqrt{P_{m}} d_{m}(i) R_{mk} + \frac{h_{k}(i)}{2N} - \frac{C_{k}}{2N} \sum_{\substack{m=1\\m\neq k}}^{K} R_{mk} \left[ \sqrt{P_{m}} d_{m}(i) + \frac{1}{2N} \sum_{\substack{n=1\\n\neq m}}^{K} \sqrt{P_{n}} d_{n}(i) R_{nm} + \frac{h_{m}(i)}{2N} \right]$$
(4.38)

最後由(4.39)式子來做最後的位元決策:

$$\hat{d}_{k}(i) = \operatorname{sgn}\left[\operatorname{Re}\left(\sum_{m=i}^{i+\frac{N_{k}}{N}-1} Z_{k}^{(2)}(m)\right)\right] + j \cdot \operatorname{sgn}\left[\operatorname{Img}\left(\sum_{m=i}^{i+\frac{N_{k}}{N}-1} Z_{k}^{(2)}(m)\right)\right]$$
(4.39)

而要估測 MAI 時候所用的 MMSE PCF 值可以使用在(4.31)所推導的結果。

比較第一種架構跟第二種架構,雖然第一種架構效能最好,在效能尚可達到 一水準的考慮之下,吾人最後採用第二種架構來實現,可以降低硬體的複雜度, 吾人稱之為 Sub-bit Random MMSE Partial PIC 偵測器,簡稱為 SRMMSE 偵測器。

### 4.4 模擬結果

義以下幾個重要的參數:  $SNR = 10\log \frac{2\sum_{k=1}^{K} P_{k}}{KN_{0}}$  (4.40)  $SIR = 10\log \frac{P_{k}}{\sum_{\substack{m=1\\m \neq k}}^{K} P_{m}}$  (4.41)

在這個章節中,吾人會做一些模擬來驗證推導結果的正確性,首先吾人先定

為了驗證吾人所推導的結果是否正確,吾人將 DMMSE 中所使用的 PCF 值,每 次以增加或減少 0.01 的方式來做模擬,每個 PCF 值作 50 次,最多增加 0.5 最多 減少 0.5,再從其中挑出有最小的 BER 的 PCF 值。吾人稱此為 Empirical optimized 的方法,此種方法可以驗證吾人所推導的 PCF 值是否為最佳的 PCF 值。

圖 4.3、4.4 是在 complex CDMA 的系統之下,使用非週期性碼,SNR=5dB、  $P_1 = P_2 = \dots P_K \times N_1 = N_2 = \dots = N_k = 16$ 的條件下所得到的圖。圖 4.3 為 PCF 值對使用者數目,由圖可看出 RMMSE 的 PCF 值會隨者使用者數目越來越多而減 少,而 DMMSE PCF 值由(4.21)知會跟各個使用者的展頻碼的關聯值有關,所以不 一定會隨著使用者數目增加而減少,且 DMMSE PCF 的值和 Empirical PCF 值相同。 此處由於所有使用者的 PG 都為 16,所以 SRMMSE 和 RMMSE 有相同的 PCF 值。圖 4.4 是使用者數目對位元錯誤率。可以看到 DMMSE 和 RMMSE 偵測器在使用者數目 不大時比傳統的偵測器效能提升非常多,而當使用者數目越大時資料跟展頻碼彼 此越接近獨立變數則 DMMSE 偵測器跟 RMMSE 偵測器越接近,且 DMMSE 偵測器跟 Empirical 偵測器一樣有最佳的效能,由於 PG 都為 16 所以 SRMMSE 偵測器和 RMMSE 偵測器是一樣的,其位元錯誤率相同。

圖 4.5、4.6 是在 complex CDMA 的系統下,使用非週期性碼,SNR=5dB、  $P_1 = P_2 = \dots P_K \times N_1 = N_3 = N_5 = \dots N_{k-1} = 16$ ,  $N_2 = N_4 = N_6 = \dots N_k = 32$ 所得到的圖。圖 4.5 為 PCF 值對使用者數目,圖 4.6 是使用者數目對位元錯誤率。 圖 4.5 可以看出 RMMSE 的 PCF 值會隨者使用者數目越來越多而減少,而 DMMSE PCF 的值相對於 RMMSE PCF 的值在一定的差距內跳動,這是因為增加了新的使用者對 現有的使用者彼此的展頻碼關聯值不一樣所造成的,同樣的,DMMSE PCF 和 Empirical PCF 有相同的值,而由於此時最小的 PG 為 16 所以 SRMMSE PCF 值會 比 RMMSE PCF 的值小一些。觀察圖 4.6,可知 Empirical 和 DMMSE 有相同的最佳 效能,而 SRMMSE 效能介於 DMMSE 和 RMMSE 之間,都比傳統的偵測器效能好很多。

圖 4.7、4.8 是在 complex CDMA 的系統下,使用非週期性碼, SNR=5dB、  $P_1 = P_2 = \dots P_K \times N_1 = 16, N_2 = N_3 = \dots = N_k = 32$ 所得到的圖。圖 4.7 為 PCF 值對使用者數目,圖 4.8 是使用者數目對位元錯誤率。同樣的,從圖 4.7 可看出 DMMSE PCF 和 Empirical PCF 有相同的值, SRMMSE PCF 值會比 RMMSE PCF 的值小 一些。觀察圖 4.8 , Empirical 和 DMMSE 有相同的最佳效能,而 SRMMSE 效能介 於 DMMSE 和 RMMSE 之間。

44



B 4.4 BER vs. user number(complex CDMA, equal power)



☑ 4.6 BER vs. user number(complex CDMA, equal power)



☑ 4.8 BER vs. user number(complex CDMA, equal power)

接著吾人考慮遠近效應的影響。圖 4.9、4.10 是在 complex CDMA 的系統之下,使用非週期性碼,SNR=5dB、SIR=-6dB、 $N_1 = N_2 = \dots = N_k = 16$ 所得到的結果。圖 4.9 為 PCF 值對使用者數目,圖 4.10 是使用者數目對位元錯誤率。由於SIR=-6dB,隨著使用者的增加,desired user 的功率會越來越大,所以有時候會發生使用者數目多的時候 BER 還比使用者數目少的 BER 低,這是正常的現象。觀察圖 4.9,DMMSE 和 Empirical 有一樣的 PCF 值,這結果表示(4.21)推導結果也適用在有遠近效應的條件之下。由於所有使用者的 PG 皆為 16 所以 SRMMSE 和 RNMSE 的值相同,由圖可看出在有遠近效應的情況下, RMMSE 和 DMMSE 的 PCF 值兩者差距更大。觀察圖 4.10,DMMSE 和 Empirical 有相同的 BER,而 RMMSE 的 放能比 DMMSE 差,由此可以看出在有遠近效應的情況下,DMMSE 和 RMMSE 而者 BER 的差距比沒有時來的更大。由於所有的使用者的 PG 都是 16,所以 RMMSE 和 SRMMSE 有相同的 BER。

圖 4.11、4.12 是在 complex CDMA 的系統之下,使用非週期性碼,SNR=5dB、 SIR=-6dB、 $N_1 = N_3 = N_5 = \dots N_{k+1} = 16$ , $N_2 = N_4 = N_6 = \dots N_k = 32$ 所得到的 圖。圖 4.11 為 PCF 值對使用者數目,圖 4.12 是使用者數目對位元錯誤率。觀察 圖 4.11,DMMSE 和 Empirical 有一樣的 PCF 值。而最小的 PG 為 16,所以 SRMMSE 的 PCF 值比 RMMSE 小。由圖 4.12 可知,DMMSE 和 Empirical 有相同的 BER,有最 佳的效能,其次為 RMMSE。最後則為 SRMMSE,都比傳統偵測器的效能好很多。

圖 4.13、4.14 是在 complex CDMA 的系統,使用非週期性碼,SNR=5dB、 SIR=-6dB、 $N_1$ =16, $N_2 = N_3 = \dots = N_k = 32$  的條件下所得到的圖。圖 4.13 為 PCF 值對使用者數目,圖 4.14 是使用者數目對位元錯誤率。觀察圖 4.13,DMMSE 和 Empirical 有一樣的 PCF 值。而最小的 PG 為 16,所以 SRMMSE 的 PCF 值比 RMMSE 的 PCF 值小。由圖 4.14 可知 DMMSE 和 Empirical 有相同的最佳效能,其次為 RMMSE,再其次為 SRMMSE,最後則是傳統偵測器。雖然 SRMMSE 效能比 DMMSE 差 一些,但是比起傳統偵測器效能還是提升很多。 由圖 4.3 到圖 4.14, 吾人可知有遠近效應的情況之下, DMMSE 仍然是有最佳的效能,但是 RMMSE 的效能跟 DMMSE 的效能相差會更大。而 SRMMSE 雖然比 RMMSE 還差,可是尚有不錯的效能,比起傳統偵測器還是好很多。









最後吾人要將提出的偵測器架構用於 WCDWA 的系統上,在第二章中有介紹 過,DPCCH 的 PG N<sub>c</sub>為固定 256,而每個使用者的 DPDCH 的 PG N<sub>d,k</sub>為 4 到 256。 而最多可以有六條 DPDCH。吾人在此考慮最常見的一般情形,所以只考慮有一條 DPDCH。

首先吾人先考慮所有使用者的功率信號相等,沒有遠近效應的影響。圖 4.15、4.16 是在 WCDMA 的系統, SNR=5dB、 $P_1 = P_2 = \dots, P_K$ 、

N<sub>d,1</sub> = N<sub>d,2</sub> = ...... = N<sub>d,k</sub> = 16 的條件下所得到的圖。圖 4.15 為 PCF 值對使用者 數目,圖 4.16 是使用者數目對位元錯誤率。觀察圖 4.15 可知 Empirical PCF 值隨著使用者數目增加呈現不規則跳動,這是因為每個增加的使用者對於現有的 使用者的展頻碼的關聯值各不相同所造成的,而 RMMSE 的 PCF 值會隨著使用者數 目增加而減少,由於所有的使用者的 DPDCH 的 PG 都一樣,所以 SRMMSE 和 RMMSE 的 PCF 值相同。 再觀察圖 4.16,可知 Empirical 有最佳的效能,而 RMMSE 非常接近 Empirical。SRMMSE 也非常接近 RMMSE 的效能,且比傳統偵測器好很多。

圖 4.17 和圖 4.18 是在 WCDMA 系統, SNR=5dB、 $P_1 = P_2 = \dots P_K$ 、  $N_{d,1} = N_{d,3} = N_{d,5} = \dots N_{d,k-1} = 16$ ,  $N_{d,2} = N_{d,4} = N_{d,6} = \dots N_{d,k} = 32$  的條件下所 得到的圖。圖 4.17 為 PCF 值對使用者數目,圖 4.18 是使用者數目對位元錯誤率。 同樣的,觀察圖 4.17 可看到和圖 4.15 一樣的趨勢。再觀察圖 4.18 可知 Empirical 有最佳的效能,而 RMMSE 非常接近 Empirical。SRMMSE 也非常接近 RMMSE 的效能, 且比傳統偵測器好很多,圖 4.18 和圖 4.16 的趨勢非常接近。

圖 4.19 和圖 4.20 是在 WCDMA 系統, SNR=OdB、 $P_1 = P_2 = \dots P_K$ 、  $N_{d,1} = 16$ ,  $N_{d,2} = \dots = N_{d,k} = 32$  的條件下所得到的圖。圖 4.19 的趨勢和圖 4.17、 圖 4.15 相同。觀察圖 4.20 可知 RMMSE 的效能非常接近 Empirical。而 SRMMSE 效能介於傳統偵測器和 RMMSE 之間。





☑ 4.17 PCF vs.user number(WCDMA, equal power)



☑ 4.19 PCF vs.user number(WCDMA, equal power)



圖 4.20 BER vs.user number (NCDMA, equal power) 最後同樣吾人考慮有遠近效應的情況。設 SIR=-6dB。圖 4.21 和圖 4.22 是 1996 在 WCDMA 的系統, SNR=5dB、SIR=-6dB、 $N_{d,1}=N_{d,2}=.....=N_{d,k}=16$ 的條件下所得 到的圖。在前面吾人已經提過由於 SIR 定義,會使得 desired user 的功率隨著 使用者數目增加而越來越大,所以有時候會發生使用者數目多的時候 BER 還比使 用者數目少的 BER 低,但是整體的趨勢是不變的。觀察圖 4.21 可看出在有遠近 效應的影響之下 RMMSE 和 SRMMSE 的 PCF 值仍然是隨著使用者數目增加而減少, Empirical ob PCF 值同樣有時候會有不規則跳動現象。接著觀察圖 4.22,可看出 受到遠近效應的影響,RMMSE 跟 Empirical 之間的差距會變大,而 SRMMSE 和 RMMSE 非常接近, SRMMSE 比傳統偵測器的效能好很多。

圖 4.23 和圖 4.24 是在 WCDMA 的系統, SNR=5dB、SIR=-6dB、 N<sub>d,1</sub>=N<sub>d,3</sub>=N<sub>d,5</sub>=.....N<sub>d,k-1</sub>=16, N<sub>d,2</sub>=N<sub>d,4</sub>=N<sub>d,6</sub>=.....N<sub>d,k</sub>=32 的條件下所得 到的圖。觀察圖 4.23, 可看出和圖 4.21 有相同趨勢。接著觀察圖 4.24, 可看出 RMMSE 比 Empirical 差一些,但是仍然有很好的效能。而 SRMMSE 效能介於 RMMSE 和傳統偵測器之間,效能比傳統偵測器好很多。

圖 4.25 和圖 4.26 是在 WCDMA 的系統,SNR=OdB、SIR=-6dB、

N<sub>d,1</sub>=16, N<sub>d,2</sub>=......=N<sub>d,k</sub>=32的條件下所得到的圖。觀察圖 4.25,同樣的和圖
4.23、圖 4.21 有相同的趨勢。再觀察圖 4.26,可知 RMMSE 接近 Empirical 的效能,而 SRMMSE 比 RMMSE 差了一些,可是還是有很好的效能。

同樣的,從圖 4.15 到圖 4.26 看出,不管有沒有遠近效應,吾人所提出的 RMMSE 和 SRMMSE 都適用於 WCDMA 系統。雖然在有遠近效應的情況下 RMMSE 和 SRMMSE 效能下降,但是兩種偵測器比起傳統偵測器還是提升了很多效能。根據 這些圖,吾人可知所提出的 RMMSE 偵測器和 SRMMSE 偵測器可以成功的應用於 WCDMA 系統上,且有不錯的效能。









# 第五章 硬體設計

在第四章中,吾人提出了三種 MMSE PCF 的偵測器,經由模擬結果驗證知道 可以適用於 WCDMA 系統,吾人最後使用第四章的 Sub-bit MMSE Partial PIC 偵 測器的架構作 FPGA 實現,本章將介紹整個多重使用者接收機的硬體設計。

## 5.1 設計流程

吾人使用電腦輔助工具來做硬體實現,設計流程如圖 5.1 所示。首先吾人先 用 Matlab 作浮點系統的模擬,可以檢查 function 的正確性和設定一些參數,也 可以評估系統的效能。接著吾人再用 Matlab 作 fixed-point 系統的模擬,來決 定各個訊號的 word length。各個信號 word length 確定以後,用 VHDL 作為硬 體描述語言做 coding。吾人使用 Modelsim 作硬體的行為模擬來驗證 VHDL code 的正確性,用 sinplify pro 作為合成軟體。

當硬體的行為模擬正確之後, 吾人使用合成軟體 sinplify pro 加入 VirtexE xcv-2000e 的 library 將 VHDL 程式轉為 RTL (register transfer level), 合成 完之後, 再作 mapping 的 timing simulation, 驗證正確之後再做 place and route 的 timing simulation, 等到此步驟也正確之後, 就可以將整個程式 download 到 Xilinx 型號 xcv-2000e-8bg560 板子上, 作 in-circuit 的驗證。



圖 5.1 硬體設計流程

## 5.2 信號處理流程

本節將介紹接收機處理信號的流程。在第二章的 WCDWA 系統簡介中有提到上 鏈的 DPDCH 的 PG 最小為 4,最大可以到 256。在不失一般性下,吾人假設所有的 使用者的 DPDCH 最小的 PG 為 16,在此吾人不考慮通道效應,只考慮 AWGN。

第k個使用者傳送的資料經過展頻和攪亂之後如下:

$$y_{k}(t) = \sqrt{P_{k}} \left[ d_{D,k}(t) c_{D,k}(t) + j \times d_{C,k}(t) c_{C,k}(t) \right] \left[ s_{1,k}(t) + j \times s_{2,k}(t) \right]$$
(5.1)

其中 $d_{D,k}(t)$ 是第k 個使用者的 DPDCH 通道傳送的資料, $d_{C,k}(t)$ 是第k 個使用者的 DPCCH 傳送的資料, $s_{1,k}(t) + j \times s_{2,k}(t)$ 是第k 個使用者的攪亂碼, $c_{D,k}(t)$ 是第k 個 使用者的 DPDCH 通道展頻碼, $c_{C,k}(t)$ 第k 個使用者的 DPCCH 通道展頻碼。而 $T_x(t)$ 則為資料經過 pulse shaping 之後,傳送出去的資料。

$$Tx(t) = \sum_{k=1}^{K} \left\{ \text{Re}(y_{k}(t)) P_{SR}(t) + j \times \text{Im}(y_{k}(t)) P_{SR}(t) \right\}$$
(5.2)

$$P_{SR}(t) = \sum_{i=-\infty}^{\infty} S_{SR}(t - iT_c)$$
(5.3)

$$S_{SR}(t) = \frac{\sin(\frac{p_t}{T_c}(1-a) + \frac{4p_t}{T_c}\cos(\frac{p_t}{T_c}(1+a)))}{\frac{p_t}{T_c}\left(1 - \left(\frac{4a_t}{T_c}\right)^2\right)}$$
(5.4)

其中 $S_{SR}(t)$ 是 square root raise cosine(SRRC) shaping filter,而 $T_c$ 是切片 持續時間,在此吾人使用的 roll factor a=0.22。假設第k 個使用者的信號其 受到的通道延遲為 $t_k$ ,接收端接收的信號可以表示如下:

$$r(t) = \sum_{k=1}^{K} \left\{ \operatorname{Re}\left( y_{k}(t-t_{k}) \right) P_{SR}(t-t_{k}) + j \times \operatorname{Im}\left( y_{k}(t-t_{k}) \right) P_{SR}(t-t_{k}) \right\} + n(t)$$
(5.5)

其中n(t)是可加白色高斯雜訊,PSD為 $N_0/2$ 。為了要符合 Nyquist pulse-shaping 理論 將r(t)經過 SRRC chip matched filter,在 $t = iT_c$ 去取樣得到 $r_{cmf}(iT_c)$ 如下:  $r_{cmf}(iT_c) = \operatorname{Re}(r(t)) * S_{sp}(t) + i \times \operatorname{Im}(r(t)) * S_{sp}(t)$ 

$$m_{f}(iT_{c}) = \operatorname{Re}(r(t)) * S_{SR}(t) + j \times \operatorname{Im}(r(t)) * S_{SR}(t)|_{t=iT_{c}}$$

$$= \sum_{k=1}^{K} \left\{ \operatorname{Re}(y_{k}(iT_{c}-t_{k})) P_{RC}(iT_{c}-t_{k}) + j \times \operatorname{Im}(y_{k}(iT_{c}-t_{k})) P_{RC}(iT_{c}-t_{k}) \right\} + n'(iT_{c})$$

(5.6)

$$P_{RC}(t) = \sum_{i=-\infty}^{\infty} S_{RC}(t-iT_c)$$
(5.7)

$$S_{RC}(t) = \frac{\cos(\frac{pat}{T_c})}{1 - \left(\frac{2at}{T_c}\right)^2} \operatorname{sinc}\left(\frac{t}{T_c}\right)$$
(5.8)

$$n'(t) = \left\{ \operatorname{Re}(n(t)) * S_{RC}(t) + j \times \operatorname{Im}(n(t)) * S_{RC}(t) \right\}$$
(5.9)

吾人可以將t,分解如(5.10)式。

$$t_k = (e_k + m_k)T_c$$
 (5.10)

 $e_k$ 為整數,  $m_k$ 為小於1的分數, 由 acquisition 可以得到 $e_k$ 的估測, 由 DLL 可以得到 $m_k$ 的估測。將 $r_{cmf}(iT_c)$ 經第l 個使用者的 interpolation filter 使用 DLL 估測的 timing error 得到的輸出如下:

$$X_{l}(iT_{c}) = \sum_{k=1}^{K} \left\{ \operatorname{Re} \left[ y_{k} \left( \left( i + \hat{\boldsymbol{m}}_{l} \right) T_{c} - \boldsymbol{t}_{k} + \hat{\boldsymbol{e}}_{l} T_{c} \right) \right] P_{RC} \left( \left( i + \hat{\boldsymbol{m}}_{l} \right) T_{c} - \boldsymbol{t}_{k} + \hat{\boldsymbol{e}}_{l} T_{c} \right) + j \operatorname{Im} \left[ y_{k} \left( \left( i + \hat{\boldsymbol{m}}_{l} \right) T_{c} - \boldsymbol{t}_{k} + \hat{\boldsymbol{e}}_{l} T_{c} \right) \right] P_{RC} \left( \left( i + \hat{\boldsymbol{m}}_{l} \right) T_{c} - \boldsymbol{t}_{k} + \hat{\boldsymbol{e}}_{l} T_{c} \right) \right\} + n' \left( \left( i + \hat{\boldsymbol{m}}_{l} \right) T_{c} + \hat{\boldsymbol{e}}_{l} T_{c} \right)$$

$$(5.11)$$

其中 $\dot{m}_{l}$ 是 DLL 估測的第l 個使用者 timing error,  $\hat{n}_{e_{l}}$ 則是由 acquisition 電路

所估測第1個使用者的通道延遲。將得到的輸出乘上攪亂碼的 conjugate 作 de-scrambling 動作,接著再經過第一級的相關器。

$$Z_{l}^{(1)}(iT_{c}) = X_{l}(iT_{c}) \left( s_{1,l}(iT_{c}) - j \times s_{2,l}(iT_{c}) \right)$$
(5.12)

$$Z_{l,D}^{(1)}(m) = \frac{1}{2N} \sum_{i=(m-1)N+1}^{mN} \operatorname{Re}\left[Z_{l}^{'(1)}(iT_{c})\right] c_{D,l}((i \mod N)T_{c})$$
(5.13)

$$Z_{l,C}^{(1)}(m) = \frac{1}{2N} \sum_{i=(m-1)N+1}^{mN} \operatorname{Im}\left[Z_{l}^{(1)}(iT_{c})\right] c_{C,l}((i \mod N)T_{c})$$
(5.14)

其中 Z<sup>(1)</sup><sub>l</sub>(*iT<sub>c</sub>*) 是第一級經過 de-scrambling 所得到的輸出,而 Z<sup>(1)</sup><sub>l,D</sub>(m) 則是第一級 第1個使用者 DPDCH 相關器的輸出, Z<sup>(1)</sup><sub>l,C</sub>(m) 是第一級第1個使用者的 DPCCH 相關 器的輸出,N則為相關器的長度,其值為 16。接著吾人用相關器的輸出重新產生 每個使用者傳送的信號。第1個使用者重新產生的信號表示如下:

$$\hat{y}_{l}(iT_{c}) = \{Z_{l,D}^{(1)}(m)c_{D,l}(iT_{c}) + j \times Z_{l,C}^{(1)}(m)c_{C,l}(iT_{c})\} \times \{s_{1,k}(iT_{c}) + j \times s_{2,k}(iT_{c})\}$$
 (5.15)  
由於信號的 timing phase 已經被調整過,需要再將重新產生的信號經過  
interpolation filer 調整回 chip matched filter 輸出的 timing phase,表示  
如下:

$$\mathbf{\hat{S}}_{l}(t) = \sum_{i=-\infty}^{i=\infty} \left\{ \operatorname{Re} \left[ \mathbf{\hat{S}}_{l}((i - \hat{m}_{l})T_{c} - \hat{e}_{l}T_{c}) \right] P_{RC,l}((i - \hat{m}_{l})T_{c} - \hat{e}_{l}T_{c}) + j \times \operatorname{Im} \left[ \mathbf{\hat{S}}_{l}((i - \hat{m}_{l})T_{c} - \hat{e}_{l}T_{c}) \right] P_{RC,l}((i - \hat{m}_{l})T_{c} - \hat{e}_{l}T_{c}) \right]$$
(5.16)

接著吾人使用(4.31)的式子來計算 PCF,得到 $C_l$ 。再將 MAI 消除得到 $\hat{X}_{l,m}(iT_c)$ ,過程表示如下:

$$\hat{X}_{l}(iT_{c}) = r_{cmf}(iT_{c}) - C_{l} \sum_{\substack{k=1\\k\neq l}}^{K} \hat{P}_{k}(iT_{c})$$
(5.17)

接著重複第一階段的過程,作 de-scrambling和 correlation 的動作。 在這之前必須再將 $\hat{X}_i(iT_e)$ 調整回原來的 timing phase,過程表示如下:

$$\mathbf{k}_{l}^{'}(iT_{c}) = \mathbf{k}_{l}((i+\hat{m}_{l})T_{c}+\hat{e}_{l}T_{c})$$
 (5.18)

$$Z_{l}^{(2)}(iT_{c}) = \mathbf{H}_{l}(iT_{c}) \left( s_{1,l}(iT_{c}) - j \times s_{2,l}(iT_{c}) \right)$$
(5.19)

$$Z_{l,D}^{(2)}(m) = \frac{1}{2N} \sum_{i=(m-1)N+1}^{mN} \operatorname{Re}\left[Z_{l}^{'(2)}(iT_{c})\right] c_{D,l}((i \mod N)T_{c})$$
(5.20)

$$Z_{l,C}^{(2)}(m) = \frac{1}{2N} \sum_{i=(m-1)N+1}^{mN} \operatorname{Im}\left[Z_{l}^{(2)}(iT_{c})\right] c_{C,l}((i \mod N)T_{c})$$
(5.21)

其中 $Z_{l}^{(2)}(iT_{c})$ 是經過 de-scrambling 所得到的輸出,而 $Z_{l,D}^{(2)}(m)$ 則是第二級第l個使用者 DPDCH 相關器的輸出, $Z_{l,C}^{(2)}(m)$ 是第一級第l個使用者的 DPCCH 相關器的輸出。最後第l個使用者的位元決策表示如下:

$$\hat{d}_{D,l}(i) = \operatorname{sgn}(\sum_{m=i}^{m=i+\frac{N_l}{N}-1} Z_{l,D}^{(2)}(m))$$
(5.22)

$$\hat{d}_{C,l}(i) = \operatorname{sgn}(\sum_{m=i}^{i+\frac{N_l}{N}-1} Z_{l,C}^{(2)}(m))$$
(5.23)

其中 $N_l$ 為第l個使用者的 PG。此外吾人用 $\mathbf{k}_i(iT_c)$ 產生 $\mathbf{k}_{l,E}(iT_c)$ 和  $\mathbf{k}_{l,L}(iT_c)$ 。其 分別為 $\mathbf{k}_l(iT_c)$ 提早 $T_c$ 和延遲 $T_c$ 所得到的信號,經過 de-scrambling 之後,作為 DLL 的輸入,而得到 *error*<sub>l</sub>(*m*),過程表示如下:

$$Z_{l,L}^{(2)}(iT_c) = \mathbf{M}_{l,L}(iT_c) \Big( s_{1,l}(iT_c) - j \times s_{2,l}(iT_c) \Big)$$
(5.24)

$$Z_{l,E}^{(2)}(iT_c) = \mathbf{k}_{l,E}(iT_c) \Big( s_{1,l}(iT_c) - j \times s_{2,l}(iT_c) \Big)$$
(5.25)

$$Z_{l,D,L}^{(2)}(m) = \frac{1}{2N} \sum_{i=(m-1)N+1}^{mN} \operatorname{Re}\left[Z_{l,L}^{(2)}(iT_c)\right] c_{D,l}((i \mod N)T_c)$$
(5.26)

$$Z_{l,C,L}^{(2)}(m) = \frac{1}{2N} \sum_{i=(m-1)N+1}^{mN} \operatorname{Im}\left[Z_{l,L}^{'(2)}(iT_c)\right] c_{C,l}((i \mod N)T_c)$$
(5.27)

$$Z_{l,D,E}^{(2)}(m) = \frac{1}{2N} \sum_{i=(m-1)N+1}^{mN} \operatorname{Re}\left[Z_{l,E}^{'(2)}(iT_c)\right] c_{D,l}((i \mod N)T_c)$$
(5.28)

$$Z_{l,C,E}^{(2)}(m) = \frac{1}{2N} \sum_{i=(m-1)N+1}^{mN} \operatorname{Im}\left[Z_{l,E}^{'(2)}(iT_c)\right] c_{C,l}((i \mod N)T_c)$$
(5.29)

$$\boldsymbol{m}_{l} = \left( \left| Z_{l,D,L}^{(2)}(m) \right| + \left| Z_{l,C,L}^{(2)}(m) \right| \right) - \left( \left| Z_{l,D,E}^{(2)}(m) \right| + \left| Z_{l,C,E}^{(2)}(m) \right| \right)$$
(5.30)

其中 $Z_{l,L}^{(2)}(iT_c)$ 和 $Z_{l,E}^{(2)}(iT_c)$ 分別是 $K_{l,L}(iT_c)$ 和 $K_{l,E}(iT_c)$ 經過 de-scrambling 之後的 信號, $Z_{l,D,L}^{(2)}(m) \times Z_{l,C,L}^{(2)}(m) \times Z_{l,D,E}^{(2)}(m)$ 和 $Z_{l,C,E}^{(2)}(m)$ 分別是 $Z_{l,L}^{(2)}(iT_c)$ 實部、 $Z_{l,L}^{(2)}(iT_c)$ 虚部、 $Z_{l,E}^{(2)}(iT_c)$ 實部和 $Z_{l,E}^{(2)}(iT_c)$ 虚部,經過 DLL 內部的相關器的輸出。吾人用  $3T_b$ 作為計算 timing error 的週期,所以 timing error estimate 每 $3T_b$ 更新一次, 表示如下:

$$\mathbf{H}_{l new} = \mathbf{H}_{l old} - h \cdot error_{l}(m)$$
(5.31)

其中 h 是 step size, 出<sub>l,new</sub> 是更新後的 timing error estimate, 出<sub>l,old</sub> 是之前使 用的 timing error estimate。

5.3 基本元件介紹

整個接收機的內部是由一些基本的元件所組成,本節將介紹這些基本元件的 功能以及其架構。

5.3.1 複數乘法器



由於 scrambling code 是複數碼,所以必須設計一個適用於複數的乘法器。 因為 scrambling code 的虛部和實部都只有+1、-1 兩種值,若為+1 則輸出為與 其相乘的資料,若為-1 則輸出為與其相乘的資料的負數,將資料取2的補數即 可得到其負數,也就是先將資料經過 inverter 再加1,所以可以設計一個多工 器如圖 5.2 來做相乘的動作。將幾個多工器結合將可以得到最後圖 5.3 的複數乘 法器的架構。

## 5.3.2 pulse shaping filter

pulse shaping filter 是用來製造傳送的資料波型, 吾人選用 SRRC 作 pulse shaping。資料經過 pulse shaping filter 等效於作 convolution 的動作。在吾人的設計中, 對於 SRRC 波型的取樣時間為 $T_c/4$ 。吾人用 20 個取樣點來代表 SRRC 的波型, 如圖 5.4 所示。為了要與 SRRC 作 convolution, 資料必須做補零的動

作,如圖 5.5。圖 5.6 即資料與 SRRC 作 convolution 的示意圖。



 $=(a_1b_1-a_2b_2)+$ 

圖 5.3 複數乘法器架構



圖 5.4 SRRC 波型取樣點



圖 5.5 (a)原本資料(b)補零之後的資料

理論上,對 SRRC 作 convolution 需要作 20 個乘的動作和 19 個加的動作才 能產生輸出,從圖 5.5 可以看出在每次的計算中,只有 5 個值不為零的乘數,因 此吾人只要多設計一個控制的機制就可以只使用五個乘法器和四個加法器來完 成 convolution。信號 data\_in 代原本沒補零的資料,吾人將 SRRC 的 20 個取樣 點分為五組 SRRC1~SRRC5,每一組四個點,{SRRC1(0~3)=SRRC(1)~SRRC(4), SRRC2(0~3)=SRRC(5)~SRRC(8), SRRC3(0~3)=SRRC(9)~SRRC(12), SRRC4(0~3)=SRRC(13)~SRRC(16), SRRC5(0~3)=SRRC(17)~SRRC(20)}, 輸出可以表示如下:

$$\begin{aligned} Output(i) = data_in(i) SRRC1(cnt) + data_in(i+1) SRRC2(cnt) + data_in(i+2) SRRC3(cnt) \\ + data_in(i+3) SRRC4(cnt) + in_data(i+4) SRRC5(cnt) \ i \in [0 \ \infty), data_in(i) = 0 \ if \ j < 0 \end{aligned}$$

## (5.32)

圖 5.6 即改良過的 convolution 的示意圖。而 cnt 信號是用來作為多工器 的控制信號,用來選擇儲哪個存在 register 的 SRRC coefficient 作為多工器的 輸出,圖 5.7 即改良過後的 SRRC pulse shaping filter 的架構







圖 5.7 改良 SRRC pulse shaping filte 架構

# 5.3.3 Chip matched filter

Chip matched filter 位於接收器的前端,用來 match 接收到的 SRRC pulse 波型。吾人使用 20 個取樣點來代表 SRRC pulse 的波型,吾人在 5.3.2 提過傳統 convolution 的動作須要 20 個乘法器和 19 個加法器才能完成。Matched filter 大致可以分為圖 5.8 三種類型,圖(a)為最基本常見的架構,但是有最長的 critical path 需要經過 19 個加法器和一個乘法器,所以 critical path 太長 是其缺點,而圖(b)的缺點則是 fan-in 太大,需要大的驅動能力,圖(c)可以改 良(a)和(b)的缺點,不會有過大的 fan-in 也不會有太長的 critical path,所 以吾人採用(c)的架構,設計如圖 5.9 的改良式 matched filter。

#### 5.3.4 Interpolation filter

通常用來做 timing adjustment 的架構有兩種,一種是數位電路和類比電路 混合的架構,如圖 5.10(a),從後端的 digital processor 找出 timing offset 再改變類比電路的取樣頻率。另外一種是全部都由數位電路所組成的架構,如圖 5.10(b),先對接收的信號作 oversamplling 的動作,然後直接在 digital processor 作 timing adjustment,得到想要的信號,而不用改變類比電路的取 樣頻率。吾人此篇論文是要實現一個全數位化的接收機,所以採用第二種架構。

為了減少運算的複雜度,所以吾人用線性 interpolation filter 來做 timing adjustment。線性的 interpolation 動作方法如圖 5.11 所示,可表示成 如(5.33)。

$$y(i) = x(n)^*(1-f) + x(n+1)^*f$$
 (5.33)

從 DLL 得到 timing error  $\hat{m}_{l}$ 後,由(5.34)和(5.35)可以決定n n f:

$$n = floor(\mathbf{m}_{l} * sr) + 5$$
 (5.34)

$$f = (\hat{m}_l * sr + 5) - n$$
 (5.35)

(5.34)式中的 floor(a)是取其最接近 a 而不超過 a 的整數。sr是 oversampling 的倍數,吾人取樣週期為 $T_c/4$ ,所以sr=4。n則是在圖 5.12 中用來決定 multiplexer 的輸出,f則決定x(n)和x(n+1)各所佔的比例來得到最後的輸出。

若吾人使用的 code tracking loop 可以 trace 到的 phase error  $\pm T_c \sim -T_c$  由於,取樣的週期為 $T_c/4$ ,所以必須要儲存九個取樣點,包括了前面的四點以 及後面的四點和現在的一點,如圖 5.12 所示。







5.10 (a)digital/analog mixed timing adjustment architecture
 (b)digital timing adjustment architecture


圖 5.12 linear interpolation filter 架構

# 5.3.5 改良式 noncoherent delay locked loop

在第三章中介紹的 nocoherent DLL 使用 early local code 和 late local code 跟進入的信號來做 correlation 而得到  $R_L(i)$  和  $R_E(i)$ ,其 error 信號則是用

 $R_L^2(i) - R_E^2(i)$  來表示 timing error。考慮到平方的動作,會增加硬體的複雜度, 所以吾人改用[23]的方法,用 $|R_L(i)| - |R_E(i)|$  來取代 $R_L^2(i) - R_E^2(i)$  作為誤差信號的 計算,從[23]中可知改良式的 DLL 效能非常接近傳統的 noncoherent DLL。吾人 計算 timing error 時是以 $3T_b$  來作為一個計算週期, $T_b$  為一個資料位元的持續時 間。所以必須要有一個 $3T_b$ 的延遲時間的 register 來儲存現在計算出來的 timing error,以便在下一個 timing error 計算出來時,再將兩者相減。如圖 5.13 即 為改良式 noncoherent DLL 的架構。



圖 5.13 改良式 noncoherent DLL 架構

#### 5.3.6 MAI 消除器

在第三章中,吾人已經介紹過 MMSE PIC 的架構,由於每個使用者都需要用 到 MAI 消除的機制,所以吾人將 MAI 消除的部分獨立為一個 共用的 entity 叫 做 cancel\_MAI。圖 5.14 即低複雜度的 MAI 消除器。r(t)是接收的信號經過 matched filter 之後的輸出。 $\hat{s}_k$ 是信號經過第k 個使用者的相關器之後,再重新產生的 信號,而 $\hat{r}_k$ 則是經過 MAI 消除器之後的第k 個使用者的估測信號。



## 5.4 接收機 FPGA 實現

在本節中將會介紹接收機的硬體架構和 on-circuit 的驗證方法及測試結果。

### 5.4.1 接收機架構

吾人設計一三個使用者的接收機其 RTL 架構圖如圖 5.15 所示。由 user entity、cancel\_MAI entity和 SRRC\_CMF entity所組成。而 user entity 的架 構如圖 5.16 所示,而 SRRC\_CMF entity和 cancel\_MAI entity在 5.3 已經介紹 過。SRRC\_CMF entity的功能是將信號經過 SRRC matched filter,再將輸出送 給 user entity,經過 user entity重新產生使用者信號,再將信號傳送給 cancel\_MAI entity,進行扣除 MAI 的動作,再將扣除掉 MAI 的信號傳回給 user entity 作偵測最後輸出位元的和估測 timing error 的動作。

整個接收機的外部介面如圖 5.17 所示。共有 27 個 pin,9 個輸出 pin 和 18 個輸入 pin。R\_I 和 R\_Q 分別代表 DPDCH 和 DPCCH 通道接收的資料。En1~En3 用 來使 user entity 在 active 狀態。Reset 則是用來重置整個接收機 Ready1~Ready3 是用來告訴外界內部的使用者是否已經做好接收準備可以開始傳送資料給接收 機。Initial\_state1 ~Initial\_state3 是用來輸入三個使用者的攪亂碼開始的 狀態,而展頻碼則是藉由 Ovsf\_code1~Ovsf\_code3 來輸入。而相關器的長度是由 Corr\_length 的輸入來決定。由撷取電路所估測的通道延遲則是藉由 Delay 來輸 入,而 Delay\_ok1~Delay\_ok3 是用來決定輸入的通道延遲估測是哪個使用者的, 當 Delay\_ok1 為 high Delay\_ok3 是用來決定輸入的通道延遲估測是哪個使用者的, 量後偵測的位元輸出則是 I\_out1、Q\_out1、I\_out2、Q\_out2、I\_out1、Q\_out1, 分別代表第 1 個、第 2 個、第 3 個使用者的 DPDCH 和 DPCCH 的偵測輸出位元。

圖 5.18 是接收機的 mapping report。由圖可知使用了 20 幾萬個 gate,而 吾人所使用的 FPGA 型號是 xcv-2000e-8bg560,共有兩百多萬個 gate,使用的資 源大約為十分之一,所以三個使用者的接收機還可以擴充為更多使用者的接收 機。而 WCDWA 的 Chip rate 為 3.84MHz,吾人的接收機設計的取樣頻率為四倍的 Chip rate,即 15.36MHz。由圖 5.19 可知最大工作頻率為 24.481MHz,可以達到 設計的要求。

76



圖 5.15 接收機 RTL 架構圖



圖 5.17 接收機外部介面圖

Design Summary

| Number of errors: 0            |                      |      |      |        |      |
|--------------------------------|----------------------|------|------|--------|------|
| Number of warnings: 0          |                      |      |      |        |      |
| Number of Slices:              | 11,132               | out  | of   | 19,200 | 57%  |
| Number of Slices containing    |                      |      |      |        |      |
| unrelated logic:               | 0                    | out  | of   | 11,132 | 6%   |
| Number of 4 input LUTs:        | 15,814               | out  | of   | 38,400 | 41%  |
| Number of bonded IOBs:         | 132                  | out  | of   | 404    | 32%  |
| IOB Flip Flops:                |                      |      |      | 12     |      |
| Number of GCLKs:               | 2                    | out  | of   | 4      | 5 6% |
| Number of GCLKIOBs:            | 1                    | out  | of   | 4      | 25%  |
| Total equivalent gate count fo | <sup>r</sup> design: | 213  | 3,62 | 24     |      |
| Additional JTAG gate count for | IOBs: 6              | ,720 |      |        |      |
| —                              |                      |      |      |        |      |

圖 5.18 接收機 mapping report

Design statistics: Minimum period: 40.127ns (Maximum frequency: 24.920MHz) Maximum combinational path delay: 42.485ns Maximum net delay: 10.126ns

#### 圖 5.19 接收機 timing report

表 5.1 是各個主要元件的開數分配表,由於吾人作硬體設計時,並沒有做各 個相同元件 timing share 的動作,所以有許多重複的相同元件,使得總開數提 高。此外如果將各個元件設計成 serial 的元件,更可以大大降低開數,可是相 對的工作頻率勢必要提高才有辦法達到原本設計的要求,而這些進一步的硬體設 計技巧在本篇論文中並未考慮,是一個值得再深入探討的題目。

表 5.2 所列為沒改良的元件閘數和改良後的元件的閘數的比較。本篇論文使 用以下方法使所設計的接收機有較低的複雜度:

- 本篇論文使用 SRMMSE 方法,跟 DMMSE 和 RSSME 比較可以省去額外儲存的硬體 開數,若使用者最高的 PG 為 256 最小為 4,則有最小 PG 的使用者必須儲存 64 筆相關器輸出,假設相關器輸出長度為 12 位元,則需要一個 12x64 的記 憶體來儲存。如表 5.2 所列,一個 12x64 的記憶體,總閘數為 6300,最多若 有兩個使用者 PG 為 4 一個 PG 為 256,則可以節省一萬多的閘數。
- 在 MI subtractor 設計上, 吾人採用第三章所提到的低複雜度的設計方法 可以看出大約省略了幾千個開數。

- 在 pulse shappingg filter 設計上, 吾人使用改良的 pulse shapping filter
   所使用的閘數大約只剩下原本的三分之一。
- 原本 DLL 使用平方的方法得到誤差信號,吾人使用取絕對值的方法,所使用 的閘數不到原先的十分之一。
- 在本篇論文所有的乘法器的設計上,吾人都以簡化的多工器來實現,所使用 的閘數也不到原先乘法器的十分之一。

|                             | 使用數目 | 單一閘數         | 所用閘數  | 所佔比例   |
|-----------------------------|------|--------------|-------|--------|
| atched filter               | 7    | 10650        | 74550 | 34.89% |
| Pulse<br>shapping<br>filter | 6    | 3493         | 20958 | 9.81%  |
| Interpolation filter        | 18   | 1896<br>3252 | 58536 | 27.4%  |
| Shift register              | 18   | 1088         | 19584 | 9.16%  |
| MAI subtractor              | 1    | 4211         | 4211  | 1.97%  |
| Correlator                  | 30   | 598          | 17940 | 8.39%  |
| Scrambler                   | 9    | 730          | 6570  | 3.07%  |

表 5.1 主要元件 閘數表

|                             | 傳統設計閘數 | 改良設計閘數 | 節省之比例或閘數 |
|-----------------------------|--------|--------|----------|
| Ram(16X64)                  | 6300   | 0      | 12600    |
| MAI                         | 0500   | 0      | 12000    |
| subtractor                  | 6522   | 4211   | 35.43%   |
| Pulse<br>shapping<br>filter | 10650  | 3493   | 67.2%    |
|                             | 010    |        | 02.010/  |
| Multiplier                  | 919    | 66     | 92.81%   |
| Square operation            | 919    | 60     | 93.47%   |

表 5.2 改良元件閘數比較表

5.4.2 電路驗證流程和測試結果

吾人電路驗證流程如下:

- 1. 用 Matlab 將傳送資料和控制訊號存為位元資料的文字檔
- 2. 將 configure 之後產生的位元串列資料下載到 FPGA 晶片上
- 3. 使用可程式資料產生器讀取文字檔產生控制訊號並傳送給接收機
- 4. 使用可程式資料產生器讀取文字檔產生要傳送的資料並傳送給接收機
- 5. 使用邏輯分析儀讀取接收機的輸出訊號
- 6. 將讀取到的訊號轉換成位元資料文字檔
- 7. 用 Matlab 讀取文字檔作資料分析

吾人設計的傳送資料是 4-bit 的 fixed-point 資料,經由上述的流程,吾人 可以計算接收機實際運作的位元錯誤率。吾人設定三個使用者的 DPDCH 的 PG 分 別為 8,16 和 32,且三個使用者的功率相等。由圖可知,吾人所設計的接收機的 位元錯誤率和用 matlab 模擬所得到浮點運算的位元錯誤率差距相當小,驗證了 吾人所設計的接收機可以正確的運作。



圖 5.20 BER Vs. SNR (MCDMA, equal power)

5.5 合併擷取電路及頻率偏移估測器之接收機 FPGA 實現

吾人在 5.4.1 所設計之接收機,是需要外部有擷取電路之配合運作方能得到 通道延遲的估測,在這一節中,吾人將[24]設計的擷取電路及頻率偏移估測電路 整合在同一 FPGA chip 之內作實現。

## 5.5.1 碼擷取及頻率偏移估測電路介面介紹

圖 5.21 即[24]所設計的碼擷取及頻率偏移估測電路的介面,共有 16 個 pin,10 個輸入 pin,6 個輸出 pin。此電路可以估測每個使用者的通道延遲並且 作頻率偏移的估測。Reset 可以使電路回到重置狀態,Enable1~Enable3 則是代 表第一個使用者到第三個使用者是否在 active 狀態,R\_I 和 R\_Q 分別代表接收 到的 PRACH 的 I 通道和 Q 通道的資料,Initial\_state1~Initial\_state3 是用來 輸入三個使用者的攪亂碼開始的狀態。Address 代表估測的的通道延遲,由於每 次只能估測一個使用者的通道延遲所以靠 Acq\_ok1~Acq\_ok3 來告訴外部電路是 哪個通道延遲被估測出來,當第一個使用者通道延遲被估測出來,則 Acq\_ok1 為 high, Acq\_ok2 和 Acq\_ok3 為 low,其餘同理類推。Angle\_phase 為估測的頻率偏移,而 Freq\_en 是用來告訴外部電路頻率偏移是否已經被估測出來。



圖 5.21 碼擷取及頻率偏移估測電路介面圖

# 5.5.2 频率偏移補償器

如要整合頻率偏移估測電路的話,吾人必須增加 frequency offset compensator 元件來做頻率補償,此元件接收頻率偏移估測電路所估測的頻率偏 移,即可對接收的信號作補償。假設原本沒有頻率偏移效應時接收機接收到的信 號為 y(t),若現有頻率偏移 f<sub>d</sub> 則收到的信號 ŷ(t)表示如下:

$$\hat{y}(t) = y(t)e^{j2pf_d t}$$
 (5.36)

從擷取電路吾人可以得到頻率偏移的估測 $\hat{f}_a$ ,吾人可以做如下的頻率偏移補償:

$$\dot{y}(t) = \dot{y}(t)e^{-j2p\hat{f}_{d}t}$$
 (5.37)

吾人可以將 $e^{j2p\hat{f}_dt}$ 分解如下:

$$e^{-j2p\hat{f}_{d}t} = \cos(-2p\hat{f}_{d}t) + j\sin(-2p\hat{f}_{d}t)$$
$$= \cos(2p\hat{f}_{d}t) - j\sin(2p\hat{f}_{d}t)$$
(5.38)

吾人將 COS 函數從0~p 取樣 32 個點 COS1~COS32 來代表 COS 函數。藉著以下的轉換公式,吾人可以由將0~p 的這 32 個點對應到-∞~∞的 COS 和 Sin 函數值

$$\cos(x) = \sin(x + P_2)$$
 (5.39)

$$\cos(x+p) = -\cos(x)$$
 (5.40)

$$\cos(x+2p) = \cos(x)$$
 (5.41)

84



圖 5.22 頻率偏移補償器架構圖

#### 5.5.3 整合碼擷取及頻率偏移估測電路之接收機架構

圖 5.23 即整合之介面硬體架構,由[24]的碼擷取及頻率偏移估測電路和5.4 所設計之接收機以及 5.5.2 所設計的頻率偏移補償器所組成。首先外界會傳送 PRACH 的資料,經由碼擷取及頻率偏移估測電路接收之後,可以得到通道延遲和 頻率偏移,再將通道延遲傳送給 MMSE Partial PIC 偵測機。而頻率偏移則傳送 給頻率偏移補償器。當傳送 DPDCH 和 DPCCH 資料時藉由 R\_I 和 R\_Q 輸入,先經過 頻率偏移補償器做完補償之後,再將補償之後的信號傳送給 MMSE Partial PIC 偵測器開始進行偵測位元的動作。圖 5.24 為整合之後的 RTL 架構圖,user1-user3 即 5.4 的 user entity,而 MAI\_subtractor 則是 5.4 中所設計的 cancel\_MAI entity。而 SRRC matched filter 即 5.4 所設計的 SRC\_CMF entity。圖 5.25 為 整合之後的外部接腳介面圖,共有 29 個 pin,20 個輸入 pin 和 9 個輸出 pin。 En\_aq1~En\_aq3 是代表碼擷取電路擷取三個使用者的通道延遲動作是否開始進 行,若在 active 狀態則為 high,反之則為 low。En\_user1~En\_user3 其作用和 圖 5.17 的 En1~En3 相同。其餘的接腳與圖 5.17 相同名字的接腳作用相同。







## 第六章 結論

近年來 WCDMA 系統變的越來越普遍,在多使用者的環境之下,MAI 是影響容量和效能最重要的因素。多使用者偵測器可以大大降低 MAI 的影響,而 PIC 偵測器被視為最適於應用在 WCDMA 系統上。不正確的 MAI 估測會大大降低 PIC 偵測器 的效能,而 partial PIC 偵測器可以解決這個問題。partial PIC 偵測器可以使 用 PCF 來消除由於不正確的 MAI 估測造成的效應。

在之前多數的 partial PIC 偵測器中都是用嘗試錯誤(trial and error)的 方法得到 PCF 值。在本篇論文中, 吾人使用最小平均平方誤差的方法得到 PCF 值, 吾人稱此種偵測器為 MMSE Patial PIC 偵測器。而為了簡單起見, 吾人只使 用了兩級的架構。在第一級中,使用相關器的輸出來重新產生想要的信號,並得 到扣除掉 MAI 的信號。藉著最小平均平方誤差(MMSE)的方法吾人可以得到計算 PCF 的式子。再將這些扣除掉 MAI 的信號通過第二級的相關器,即可得到最後的 位元決策。從第四章所做的模擬, 吾人可以知道偵測器的效能受的 PCF 相當大的 影響, 且使用吾人所推導出來的 PCF 值可以使得 partial PIC 偵測器相較於傳統 偵測器和 full PIC 偵測器有較好的效能, 且吾人所推導的式子也可以應用於 WCDMA 系統上。最後, 依照一般的 FPGA 設計流程, 吾人設計了一個可以應用在 WCDMA 系統上的低複雜度全數位化 MMSE partial PIC 接收機。並將此接收機跟 碼撷取電路以及頻率偏移估測電路結合, 讓整個接收機更為完整。在本篇論文 中, 並沒有考慮到多重路徑的問題。此外在硬體設計上, 並沒有考慮面積最佳化 和功率最佳化的問題。這些問題都是值得再做進一步深入研究的議題。

## 參考文獻

[1] Peterson R.L., Ziemer R.E., and Borth D.E., "Introduction to spread spectrum communication," Prentice-Hall, 1995.

[2] Pickholtz R.L., Schilling D.L., and Milstein L.B., "Theory of Spread-Spectrum Communications-A Tutorial," *IEEE Trans. Commun.*, vol. COM-30, no. 5, pp. 855~883, May. 1982.

[3] Huang W., Andonovic I., and, Nakagawa M., "Code tracking of DS-CDMA systems in the presence of multiuser interference and additive noise," *IEEE 5th International Symposium*, vol. 3, pp. 843~847, 1998.

[4] Verdu S., "Minimum probability of error for asynchronous Gaussian multiple-access channels," *IEEE Trans. Inform. Theory*, vol. IT-32, pp. 85~96, Jan. 1986.

[5] Shimon Moshavi, Bellcore, "Multi-User Detection for DS-CDMA Communication," IEEE Communications Magazine, vol. 34, pp. 124~136, Oct. 1996.

[6] Dimitris Koulakiotis and A. Hamid Aghvami CTR, "Data Detection Techniques for DS/CDMA Mobile Systems: A review," *IEEE Personal Communication*, vol. 7, pp.24~34, June 2000.

[7] Dariush Divasalar, Marvin K. Simon, and Dan Raphaeli, "Improved parallel interference cancellation for CDMA," *IEEE Trans. Commun.*, vol. 46, no. 2, pp. 258~268, Feb. 1998.

[8] Neiyer S. Correal, R. Michael Buehree, and Brain D. Worner, "A
DSP-Based DS-CDMA multiuser receiver employing partial parallel
interference cancellation," *IEEE J. Select. Areas Commun.*, vol. 17, no.
4, pp. 613~630, Apr. 1999.

[9] Chaudhury, P.; Mohr, W.; Onoe, S, "The 3GPP proposal for IMT-2000" *IEEE Communications Magazine*, Volume: 37 Issue: 12. pp: 72 – 81 Dec 1999.
[10] Baier, A.; Fiebig, U-C; Granzow, W.; Koch, W, "Design study
for a CDMA-based third-generation mobile radio system", Selected Areas
in *Communications, IEEE Journal* on, Vol. 12 pp: 733-743, May 1994.
[11] The Web site for 3GPP: <u>http://www.3gpp.org</u>
[12] Harri Holma and Antti Toskala, "WCDMA for UMTS", wiley 2000.

[13] Jhong Sam Lee,Leonard E.Miller" CDMA Systems Engineerring Handbook, " Artech House , Inc. 1998.

[14] Shimon Moshavi, Bellcore, "Multi-User Detection for DS-CDMA Communication," IEEE Communications Magazine, vol. 34, pp. 124~136, Oct. 1996.

[15] Lupas R.; Verdu S., "Linear multiuser detectors for synchronous code-division multiple-access channels," IEEE, Trans. Info. Theory, vol. 35, pp. 123~136, Jan. 1989.

[16] Xie, Z.; Short, R.T.; Rushforth, C.K., "A family of suboptimum detectors for coherent multiuser communications," *IEEE Commun.*, vol. 8, pp. 683 -690, May 1990.

[17] Holtzman J. M., "DS/CDMA successive interference cancellation," *IEEE Third International Symposium*, vol. 1, pp.69~78, 1994.

[18] Varanasi M. K. and Aazhang B., "Multistage Detection in Asynchronous
Code-Division Multiplt-Access Communications," *IEEE Trans. Commun.*, vol.
46, no. 11, pp. 1492~1432, Nov. 1998.

[19] Divsalar D. and Simon M., "Improved CDMA Performance Using Parallel Interference Cancellation," *JPL publication 95~21*, Oct. 1995, Jet Propulsion Laboratory, USA.

91

[20] Pursley, M. B., "Performance evaluation for phase-coded spread spectrum multiple-access communication-Part I: System analysis," *IEEE Trans. Commun.*, vol. 25, pp. 795~799, 1977.

[21] Morrow, R. K., "Accurate CDMA BER calculations with low computational complexity," IEEE Trans. Commun., vol. 46, pp. 1413~1417, Nov. 1998.

[22] "An all digital MMSE Multi-user Receiver for W-CDMA: Algorithm and Its FPGA Implementation," 國立交通大學 林千恵碩士論文, June 2002.

[23] "An all digital multiuser CDMA receiver and its ASIC design," 國 立交通大學 邱健忠碩士論文, June 2001.

[24] "Fast Code Acquisition and Frequency Offset Estimation for W-CDMA Systems and Its FPGA Implementation," 國立交通大學 沈英宗碩士論文,

June 2004.

