無線服務提供商期望引進的無線基礎系統具有更高的性能以及更低的成本,這將推動對標準的或現成元件不斷提高的要求,同時力求使這些器件在系統生命周期的最初時期就具有盡可能高的性能。開放標準,特別是串行RapidIO為開發者提供了合適的工具,可滿足由ATCA、GbE和PCI Express等其它標準作為補充,由硬件和軟件解決方案組成的廣泛的生態系統需求。 本文將討論串行RapidIO交換機結構,特別是新型IDT預處理交換(PPS)在支持DSP、FPGA或ASIC等關鍵元件在無線基礎設施解決方案的開發方面的優勢。這可以通過一個針對未來基帶卡 (baseband card)的理想架構來展示,基帶卡是無線設備供應商試圖改善性能并降低成本的關鍵部分之一。我們將詳細討論這個關鍵系統,以及與這些新系統有關的板卡級問題,并為設計者提出利用集中式基帶交換機(baseband switch)的并行功能來獲得最高性能效率的建議。 基站收發信臺架構 圖1顯示了一個近乎理想的基站收發信臺(BTS)架構,可支持串行RapidIO互連,提供一個可支持CPU、DSP、FPGA或ASIC的結構。在這種類型的架構中,設計者在各種處理端點(endpoint)之間分配主要應用任務的功能劃分方面有廣泛的靈活性。該架構也易于支持擴展,有助于滿足具體應用根據性能和成本要求對端點數量的增減處理。 基帶交換機是基帶卡的核心。它可以把DSP與基帶處理器連接起來,例如用于CDMA系統的碼片率處理器(CRP)。如果DSP可以進行碼片率處理等,就可以簡化FPGA或ASIC,甚至在某些情況下就可以不再使用。 此時,它也可以獲得串行RapidIO帶給應用固有的元件級和板卡級互連的好處。無線基站里的DSP刀片需要高度簡化和高速互連,來進行數據傳輸和協議管理。這些計算密集的嵌入式應用需要系統在信號處理器和緊密連接的DSP陣列之間快速移動數據,開放標準串行RapidIO規范專門可滿足高性能嵌入式系統的需求。 ![]() 圖1:靈活的架構可以根據需要增加或減少CRP/DSP。 傳統上,基帶卡都是使用外部存儲器接口等簡單接口在芯片之間進行數據或采樣(sample)的傳輸。這種方法對軟件的要求很高,因為它是一種“拉” 式接口,其雙向特性會使帶寬利用率降低到25%。 為了確保基帶卡可以擴展到更高速度,設計者需要一種新的串行接口。這種串行接口必須比存儲器接口更智能。同時,它也必須具有初始化和與多處理模塊通信的能力。該功能需要基帶卡上有可自動識別和初始化的器件,以及使這些器件可以靈活通信的協議。該協議必須支持確認的和非確認的推拉式通信和帶內中斷,以便訪問軟件。開發基帶算法軟件本身就是一個挑戰性的工作。理想的協議將使軟件程序員不必再重復開發一個通信協議。 如上所述,串行RapidIO是專為滿足這些需求而量身定制的,Altera、飛思卡爾、 IDT、TI和賽靈思等公司都已提供了各種集成電路。串行RapidIO也可為圖1中描述的基帶架構的開發提供支持。 串行 RapidIO標準補充了開放式基站架構發起組織(OBSAI)、通用公共無線電接口(CPRI)和先進電信計算架構(ATCA)帶給機箱和系統級的模塊化優勢,這是通過將這些優勢擴展到板卡和元件級實現的。OBSAI和CPRI都沒有規定基站設計中的線卡接口。 此外,串行 RapidIO對DSP集群高度靈活的支持使設計者可以具有成本效益的方式開發極其靈活和可擴展的架構,這種方式在初期不能被簡單地復制,是一種基于 FPGA或ASIC的設計。例如,基站設計者可采用串行RapidIO為宏蜂窩應用開發一個DSP密集的系統,實現新技術的快速應用,以支持更大的區域覆蓋。然后重復利用原來設計中的絕大部分,用于微蜂窩或微微蜂窩環境的小規模解決方案,這樣就可以具有成本效益的方式滿足預期的飽和度及密度。 最重要的是,串行RapidIO可通過集成控制和數據流量,將簡單而耗時的任務從處理器卸載,以及區分高低優先級數據流量來簡化處理器之間的通信。 回到圖1的架構,基帶交換機也可通過CPRI/OBSAI或使用專用接口(基于LVDS)連接射頻卡,該接口通常可支持高速采樣流量。速率可高達 3,072Mbps(CPRI定義),且該系統可支持多種形式的類似鏈路,通常每個射頻卡可對應一個鏈路。 在上行鏈路端,來自射頻卡的采樣被分發到處理模塊中。對于基于CDMA的系統,這些采樣被傳輸到CRP中。傳輸過程中,采樣也會根據處理器或算法的需求進行格式化。本文后半部分將詳細介紹這種格式化。 一旦碼片率處理完成,多個CRP中出現的用戶通道就開始進行符號率處理(如前向糾錯、語音處理等)。由于采樣被轉換成位,而且CDMA的去擴頻功能已經完成,該功能需要的帶寬更低。此時,這個“符號”信息需要從CRP轉換到DSP。當DSP完成符號率處理后,信息包必須轉換成傳輸模塊轉交給網絡的上層。這兩種交換操作均由基帶交換機執行。 基帶架構優勢 正如前面提到的,圖1中描述的架構具有極高的靈活性和可擴展性,在這種架構中,設計者在分配各種處理端點之間的主要應用任務功能劃分方面有廣泛的靈活性。由于架構已經不再與運算密切相關,流量和處理能力可在運行時間內從一個器件轉移到另外一個器件。該架構也具有可擴展性,有助于滿足具體應用在性能和成本方面所需的端點數量增減。例如,可以輕易改變DRP和DSP的數量,以實現相同的設計可以匹配到從微微蜂窩到大型基站的設計要求。 包括IDT公司在內的多家供應商都可提供交換機解決方案執行這種基于結構(fabric- based)的架構。最近推出的IDT PPS為該應用帶來了數據分配和DSP加速的組合方案。PPS不僅可作為交換機連接各種串行RapidIO端點,也可為集群(cluster)中DSP重復格式化需求提供數據處理能力,這種格式化需求可占用關鍵的帶寬。 不同的器件和算法以不同的采樣和符號長度進行工作。例如,CPRI可把采樣長度定義為8至40位。處理器一般以8、16或32位的采樣長度工作。不同的算法要求采樣具有特定的順序(I-Q一起或分開、過采樣與常規采樣一起或分開,以及其它組合),因此,這些數據格式化操作需要在CRP和DSP中執行。根據選擇的DSP和CRP的不同,系統設計者應該意識到這些操作可以有多種組合,處理器可能需要花很多周期進行這些操作。PPS可把這些操作集中到交換機中,以減少處理器負擔。通過把加法/同步模塊與交換機集成到一起,對齊多個CRP中的信息包,累加到下行鏈路中,以帶來更多的價值。普通的串行 RapidIO交換機一般需要累加器(summer)和同步器件(synchronizer)的支持,這增加了設計的元件數量和復雜性。 增強的交換功能使基帶架構受益 PPS不僅是一個協議交換機,而且是專為支持基帶應用中的FPGA或DSP集群而優化的,它為基帶卡集成了大量獨一無二的其它功能。因此,如果交換機架構允許的話,PPS可更有效地使系統在基帶交換機中執行表1中所示的功能。 表1:系統在基帶交換機中執行的功能。 ![]() 為了評估把這些功能集成到交換機操作的好處,首先必須確定通過一個如基帶交換機的集中器件,與如DSP的處理器,或者如FPGA或ASIC的端點相比,執行上述操作可節省百分之多少的處理周期。 假設所有的碼片率和符號率處理功能都可以在一個或更多1GHz的DSP中實現,那么每個功能都是一個WCDMA功能的實例。每個卸載數據都包括前一個功能,例如27.5%的采樣順序變化就包括采樣符號擴展。假設每個采樣上的每次功能執行有1~2個周期的延遲,12個天線通道,兩倍過采樣率的 3.84Mcps(百萬樣片每秒)WCDMA系統。 一次采樣的每個功能延遲1~2個周期是比較樂觀的情況,假設每個采樣都是在一級存儲器或寄存器中進行存取。實際的情況是,采樣是存儲在更大的二級存儲器中,第一次采樣的存儲器的存取延遲增加到9~10個周期(1GHz DSP),而且每個后來的采樣需要兩個周期。在最差的情況下,糟糕的軟件存儲器管理可以迫使每次采樣花8~9個周期來讀取二級存儲器。在極端情況下,由于所有資源都被用于數據格式化了,DSP可能無法用于其它目的。 本文小結 對于設計者來說,構建下一代基帶卡和基于連接了多個DSP、FPGA和ASIC的串行RapidIO接口的結構型架構具有許多優勢。由于采用現成的元件,這種架構可降低開發和部署成本,同時可確保滿足廣泛應用和市場條件所需的靈活性和可擴展性。它可以簡化設計,并可最大限度地降低增加其它功能和系統升級的成本,還可以大大簡化軟件開發而不增加延遲。通過在信息包和采樣處理等集中的串行RapidIO交換機中采用并行功能,設計者可提高處理效率,并可在降低成本的同時增加性能。 作者:IDT公司高級系統架構師Bertan Tezcan,流量控制管理部高級產品經理Bill Beane 來源:電子工程專輯 2007-3 |