Trình biên dịch C/C++ tốt nhất? p1

So sánh 9 trình biên dịch C/C++ theo các tiêu chí nổi bật của ngôn ngữ: sự linh động, tính khả chuyển, hiệu quả và tốc độ.

Mặc dù xuất hiện nhiều ngôn ngữ lập trình và công nghệ mới, C++ vẫn là công cụ chính của nhiều nhà phát triển, có thể vị trí của nó sẽ vẫn được duy trì nhiều năm nữa. C++ nổi bật về sự linh động, tính khả chuyển, hiệu quả và tốc độ. Mặc dù năng lực xử lý của máy tính đã có sự gia tăng đáng kể, hiệu suất phần mềm vẫn là yếu tố quan trọng, C++ là ngôn ngữ sẽ cho hiệu suất vượt trội hầu như về mọi phương diện nếu được sử dụng một cách đúng đắn.

Bài viết này so sánh 9 trình biên dịch C++ phổ biến, đánh giá về hiệu suất, tính năng và công cụ. Các trình biên dịch (TBD) hoặc là chỉ hỗ trợ môi trường Win32, hoặc là hỗ trợ các biến thể khác Win32. Việc kiểm tra đánh giá được thực hiện trên 1 máy Windows XP Pro (1 BXL 2GHz, 512MB RAM) hoàn toàn không chạy các tác vụ khác.

Thời gian biên dịchTrong nhiều trường hợp, thời gian biên dịch không quan trọng. Tuy nhiên, nó là yếu tố then chốt trong các hệ thống lớn hay trong môi trường phát triển thường hay biên dịch ứng dụng (như trong mô hình phát triển eXtreme Programming). Các yếu tố quan trọng trong quá trình biên dịch/liên kết mã nguồn bao gồm: số lượng các thư viện, sử dụng các thành phần được biên dịch trước, độ phức tạp của mã lệnh, yêu cầu về tối ưu (cho cả biên dịch và liên kết) và kích thước các mô đun biên dịch. Các tình huống được xem xét:

1. C1. Một file C lớn (1000 hàm), duy nhất (không ‘include’); chỉ biên dịch, không tối ưu.2. C2. Một file C với số lượng file include lớn (500); chỉ biên dịch, không tối ưu.3. C3. Một file C với số lượng file include lồng nhau nhiều cấp (100), mỗi file được include bởi file trước nó và file main. Thử nghiệm đánh giá ảnh hưởng của việc include nhiều cấp; chỉ biên dịch không tối ưu.4. pch. Một bộ file C++ (main.cpp, pch.cpp và 40 file lớp .h/.cpp) dùng chung header, (biên dịch và liên kết; các header được biên dịch trước; không tối ưu).5. whereis. Một file C++ duy nhất nhưng phức tạp với nhiều include thư viện hệ điều hành và template (chỉ biên dịch; tối ưu về kích thước).6. MMComBsc. Thư viện DLL lớn (44 file nguồn C và 37 file nguồn C++, 111 file header, kích thước biên dịch 80KB) bao gồm các hàm COM và các lớp (biên dịch và liên kết; các header được biên dịch trước; tối ưu về kích thước).7. zlib. Thư viện nén dữ liệu tổng quát và miễn phí, có thể chạy trên nhiều nền tảng hệ thống.

Dùng các script Python (http://www.ddj.com/ftp/2003/200310/cppcomp.zip) để tạo các file nguồn cho các tình huống 1- 4. Mã nguồn whereis có ở http://stlsoft.org/ (file nhị phân cập nhật có ở http://synesis.com.au/r_systools.html). Các file nguồn cho MMComBs.dll có nhiều thứ liên quan đến vấn đề bản quyền vì vậy bạn tạm chấp nhận thông tin cung cấp ở đây!Kết quả kiểm tra các tình huống 1- 3 và 5 được lấy với ptime (http://synesis.com.au/r_systools.html) bằng cách thực hiện nhiều lần (15 lần), bỏ qua 2 kết quả cao nhất và 1 kết quả thấp nhất, còn lại lấy trung bình nhằm giảm sai lệch do bước đệm hoặc khởi động. Kiểm tra các tình huống 4, 6 và 7 dùng các makefile, đo thời gian bằng ptime. Các kết quả kiểm tra được thể hiện trong Bảng 1.Khái niệm ‘Did Not Compile’ (DNC, không biên dịch) của CodeWarrior trong các kết quả ở tình huống C3 là do TBD từ chối xử lý include lồng nhau lên tới 100 cấp; các thử nghiệm cho thấy số cấp giới hạn là 30. Thông tin trợ giúp của CodeWarrior: ‘Để khắc phục vấn đề này, hãy nghiên cứu trình tự lô gic ẩn đằng sau các #include lồng nhau. Có thể có cách tách các #include lồng nhau nhiều cấp thành một loạt #include lồng nhau ít cấp hơn’ – điều này có thể đúng nhưng không phải lúc nào cũng có thể thực hiện được. Watcom có thể không biên dịch các tình huống whereis và MMComBsc vì nó không hỗ trợ template hiệu quả.Có một số khác biệt đáng kể về hiệu suất. Borland tỏ ra tốt nhất, theo sát là VC++ 6, Digital Mars và VC++ 7 đồng hạng 3. CodeWarrior, GCC và Intel là các TBD chậm chạp nhất trong nhóm. VC++ 7 biên dịch pch nhanh hơn 43 lần so với CodeWarrior! VC++ 7.1 chậm hơn VC++ 7.0 trong mọi thử nghiệm.

CN Table1 Trình biên dịch C/C++ tốt nhất?

Bảng 1:Thời gian biên dịch(ms) của 7 tình huống với các trình biên dịch(các con số in đậm là những kết quả tốt nhất)

Tốc độ sinh mãKế tiếp chúng ta xem xét tốc độ sinh mã, giới hạn ở 5 tình huống sau:1. Dhrystone (http://www.webopedia .com/TERM/D/Dhrystone.html). Phép đo này kiểm tra tốc độ tính toán số nguyên. Vì nó sử dụng toàn bộ CPU (không có bất kỳ tác vụ truy cập tài nguyên hay I/O nào trong quá trình kiểm tra), đây là phép đo tốt về tốc độ mã lệnh đã được biên dịch. Tốc độ được đo với số Dhrystone trong 1 giây (số càng lớn càng tốt).

2. Int2string. Chuyển đổi số nguyên sang dạng chuỗi là công việc có thể hao tốn tài nguyên hệ thống. Các số nguyên lên hàng triệu chữ số (0->9.999,999) được chuyển sang dạng chuỗi, và các độ dài chuỗi được cộng dồn lại. Ở đây sử dụng 2 phương pháp chuyển đổi:o Dùng hàm thư viện sprintf(). Tốc độ này phản ánh sự khác biệt về hiệu suất của thư viện các TBD. (Intel dùng thư viện của VC++ 7.0).o Dùng template integer_to_string<>. Tốc độ này phản ánh trực tiếp tốc độ của mã lệnh đã biên dịch.

3. StringTok. Tình huống này tạo một tập chuỗi lớn để phân tách từ mã (token), dùng ‘;’ làm dấu phân cách. Nó phân tách chuỗi theo từ mã, sau đó lặp vòng tuần tự để tính tổng các độ dài từ mã. Ở đây dùng các thư viện phân tách từ mã boost::tokenizer<>(http:’//boost.org) và stlsoft::string_tokenizer<>(http://stlsoft.org/).

4. RectArr. Để bắt các TBD phát huy hết năng lực sinh mã trong các tình huống phức tạp, ở đây dùng template mảng 3D fixed_array_2d<> của STLSoft, lập tham số là kiểu giá trị stlsoft::basic_simple_string thay vì std::basic_string<> để chú trọng đến ảnh hưởng hiệu suất của TBD và giảm những khác biệt trong các thư viện chuẩn. Tình huống này tạo một mảng 3D có kích thước thay đổi (100x100x100) và lặp vòng qua cả 3 ‘chiều’ của mảng, gán một giá trị ngẫu nhiên cho mỗi phần tử. Có 2 cách thực hiện:o Cách đầu tiên thực hiện việc đếm một lầno Cách thứ hai thực hiện 10 lần. Việc cấp phát và khởi tạo 1 triệu phần tử được thực hiện dần.

5. zlib. Đây là thư viện đặc trưng trong nhiều ứng dụng (http://zlib.org). Nó là phép kiểm tra hiệu suất có giá trị. Chương trình kiểm tra thực hiện nén toàn bộ nội dung một file nguồn rồi xuất sang một file kết quả trong một vòng lặp đo thời gian. Ở đây thực hiện biên dịch cả mã nguồn zlib 1.1.4 và chương trình kiểm tra với 9 TBD và thực thi nó với một file lớn (65 MB) và một file nhỏ (149 KB).Khác với tình huống Dhrystone (có cơ chế đo thời gian riêng), tất cả các tình huống khác đều thực hiện định thời dựa trên lớp performance_counter của WinSTL (xem http://winstl.org/ và http://www.windevnet.com/documents/win0305a/). Các kết quả phản ánh tốc độ mã lệnh thuần túy, không bị ảnh hưởng của hệ điều hành và các tác động khác. Tất cả tình huống đều được tối ưu về tốc độ (-O2, -opt speed, -o+speed, -O3, -O2, -O2, -ot). Bảng 2 thể hiện kết quả.Đặc biệt tình huống Dhrystone được thực hiện chạy kiểm tra 9 lần, bỏ qua các giá trị cao nhất và thấp nhất, còn lại tính trung bình. (Mã nguồn của tất cả các tình huống có ở http://www.ddj.com/ftp/2003/200310/cppcomp.zip)Giá trị ‘DNC’ của Digital Mars là do TBD này không được hỗ trợ trong thư viện Boost 1.30. Vấn đề tương thích Boost/Digital Mars đang được thực hiện, và có thể đã hoàn tất khi bạn đọc bài viết này. Các giá trị ‘DNC’ của Watcom phản ánh việc thiếu khả năng hỗ trợ template nói chung của nó.

Intel vượt lên trên các TBD khác, nó nhanh nhất ở 2 tình huống và đứng hạng 2 ở 5 tình huống còn lại. (Thực ra hiệu suất kém của nó là ở tình huống Int2String(sprintf), trong đó hiệu suất của nó tùy thuộc nhiều vào hàm sprintf() của thư viện VC++ 7.0). Digital Mars, VC++ 7.0 và VC++ 7.1 ngang ngửa nhau ở vị trí thứ hai.Do không nổi bật ở 5 tình huống, và cho tốc độ kém ở 2 tình huống khác, Watcom đành phải xếp cuối bảng. Tuy nhiên, nó chiến thắng ở tình huống Int2String(sprintf()), vì vậy cũng không đến nỗi tệ. Borland và CodeWarrior thực hiện tốt ở vài tình huống – Borland nhanh nhất với zlib nhưng lại mất điểm ở những tình huống khác. GCC thực hiện kém ở tất cả các tình huống, ngoại trừ 2 biến thể của STLSoft.Những khác biệt giữa các biến thể của các tình huống Int2String và StringTok không đáng kể. Dùng template integer_to_string<> cải thiện tốc độ đáng kể, thời gian thực thi chỉ khoảng 15% đến 55% so với printf(). Các bộ phân tích từ mã chuỗi cho thấy có sự khác biệt đáng kể: thời gian thực thi của bộ phân tích từ mã của STLSoft khoảng từ 6 đến 26 % so với Boost.