Biết Python – quen ngay Julia
Bài viết được sự cho phép của tác giả Nguyễn Việt Hưng
Julia là ngôn ngữ lập trình mới, trông rất giống code Python, chạy nhanh hơn Python3 ít nhất 2 lần và có nhiều tính năng hấp dẫn. Bạn không cần phải từ bỏ Python hay ngôn ngữ XYZ để học Julia, Julia chỉ đơn giản là một bông hoa đẹp mà ai thích… thì múc.
Julia là ngôn ngữ lập trình “làm gì cũng được”, nhưng được tập trung vào lĩnh vực tính toán khoa học và muốn thế chỗ Python (nhưng đường còn dài, và còn nhiều hơn chông gai).
Cài đặt
Xem https://docs.julialang.org/en/v1/
Tại thời điểm viết bài (2019 tháng 4), Julia ở bản 1.1.0 – đã ổn định hơn trước rất nhiều, ít bug hơn, chạy nhanh hơn.
Từ Python ngó sang
Julia trông rất giống Python, cách dùng các học, cách code cũng tương tự, nên nếu biết Python thì việc viết được code để làm công việc thường ngày (của 1 DevOps) chỉ trong vòng vài tiếng.
REPL
Gõ lệnh trực tiếp bằng lệnh julia
trên Linux/MacOS
$ julia
_
_ _ _(_)_ | Documentation: https://docs.julialang.org
(_) | (_) (_) |
_ _ _| |_ __ _ | Type "?" for help, "]?" for Pkg help.
| | | | | | |/ _` | |
| | |_| | | | (_| | | Version 1.1.0 (2019-01-21)
_/ |\__'_|_|_|\__'_| | Official https://julialang.org/ release
|__/ |
julia> 1 + 1
2
Đây gọi là chế độ “REPL” (Read-Eval-Print-Loop) == (gõ vào – chạy – in ra kết quả – cứ thế mà làm).
IPython
Không cần cài thêm gì, Julia REPL tự có đủ các tính năng thiết yếu của IPython.
Đọc document của 1 function? Gõ ? rồi gõ bất cứ cái gì cần hỏi:
julia> 1 + 1
2
###### gõ ? xong , biến từ julia> thành help?>
help?> sum
search: sum sum! summary cumsum cumsum! isnumeric VersionNumber issubnormal get_zero_subnormals
...
sum(itr)
Returns the sum of all elements in a collection.
Màu mè (syntax highlight) cũng tự có sẵn rồi.
Chạy file code
File code Julia có đuôi .jl
, ví dụ hello.jl
. Chạy file code bằng cách gõ lệnh: julia hello.jl
Cài đặt package
Để cài các package trên mạng, sử dụng package manager CÓ SẴN của Julia. Chuyện về virtualenv
tạm chưa bàn tới ở đây vì khá rõ ràng là không cần thiết (cài package không cần gõ sudo gì cả).
Việc cài đặt package trong Julia thực hiện hơi khác so với Python Pip hay NodeJS NPM một chút. Sẽ không có câu lệnh nào để gõ cả, không có chương trình thêm nào hết. Julia thực hiện cài đặt package khi một đoạn code Julia được chạy (gọi function thực hiện cài đặt).
Ví dụ một file tên (tuỳ ý) như sau:
# gicungduoc.jl
using Pkg
Pkg.add("HTTP")
Pkg.add("JSON")
Pkg.add("DocOpt")
Chạy code này: julia gicungduoc.jl
sẽ cài đặt các package, sau đó cứ thế mà dùng các thư viện này.
The good, the OK, the ugly
The good – phần tốt
Pipe operator
Tốt hay xấu là tuỳ do từng người tự phán xét. Hãy xem đoạn code sau:
Python: ''.join(" Py thon ".strip().split())
Julia: " Py thon " |> strip |> split |> xs -> join(xs, "")
Python
def double(x):
return x * 2
def incr(x):
return x + 1
print(incr(double(incr(2))))
double(x) = x * 2
incr(x) = x + 1
println(2 |> incr |> double |> incr)
# 7
|>
gọi là Piping operator
, lấy đầu ra của function này làm đầu vào cho function khác. Giúp việc goi funciton liên tục (và đọc nó) dễ dàng hơn. Giống UNIX command.
Nhanh
Julia thường nhanh hơn Python ít nhất 2 lần
Không quan trọng indentation
Dù bạn thụt ra thụt vào 2 3 4 5 ký tự, hay dùng tab đều không quan trọng. Chuyện này vốn gây đau đầu cho không ít người dùng Python.
Python
s = 0
for i in range(1000):
if i % 3 == 0 or i % 5 == 0:
s = s + i
print(s)
Julia
for i in 1:999
if i % 3 == 0 || i % 5 == 0
global s = s + i
end
end
println(s)
# 233168
Julia dùng từ end
để kết thúc if
hay for
, nên không cần thiết sử dụng dấu cách hay tab để thụt dòng. Thậm chí có thể dùng ;
để phân cách các phần, và viết trên 1 dòng (bạn KHÔNG THỂ làm điều này với Python khi có for):
julia> s = 0; for i in 1:999; if i % 3 == 0 || i % 5 == 0; global s = s + i ; end ; end; println(s)
233168
Range bao gồm cả số kết thúc
Một điều gây khó chịu với người mới code Python là phần kết thúc của range không được tính. Tức nếu viết range(1,1000)
thì chỉ có từ 1 đến 999. Trong đầu luôn phải nhớ bớt đi 1. Julia 1:999
nghĩa là 1 đến 999, không thêm bớt gì.
Không bị “leak” biến i trong vòng lặp ra ngoài
Đây là 1 bug của Python, do sau này quá muộn để sửa, người ta coi nó như 1 tính năng.
for i in [1,2,3]:
print(i)
print(i) # i vốn ở trong vòng lặp for, nay thoát ra ngoài với giá trị = 3
Hỗ trợ functional
Viết map trong Julia rất dễ chịu – dễ đọc:
map([1,2,3]) do x
x + 1
end
Cách viết dùng lambda:
map(x -> x+1, [1,2,3])
sẽ tạo array chứa [2,3,4]
Python
list(map(lambda x: x+1, [1,2,3]))
The OK – ổn
Index from 1
Chuyện này gây sốc với lập trình viên lâu năm C, Java, PHP, Python … Nhưng không phải là hiếm có. Lua, MatLab, R đều dùng index từ 1.
ns=[1,2,3,4]; print(ns[4])
Trong Julia code này sẽ in ra số 4 nhưng Python sẽ xảy ra exception do Python index đếm từ 0
Dùng nhiều sẽ quen và cũng không ghê gớm lắm, do Julia sử dụng cả phần cuối của range.
Ví dụ slice: Python lấy 3 số đầu tiên của list:
ns[0:3]
Julia:
ns[1:3]
Đều kết thúc là 3 – đều là số phần tử cần lấy.
Nhưng tệ hơn khi cần lấy 2 phần tử cuối:
ns[end-1:end]
end
là một index magic (tự xuất hiện), đại diện cho index của phần tử cuối cùng.
Trong ví dụ này gõ số 4 thay end cũng được.
The ugly – thảm hại
Unicode string – sẽ rất đau đầu khi chuyển từ Python sang.
Index của string (mặc định Unicode) trong Julia là byte index, không phải index theo thứ tự của ký tự.
Python
In [16]: w = "Điêu"
In [20]: w[0],w[1]
Out[20]: ('Đ', 'i')
Julia
ulia> w = "Điêu"
"Điêu"
julia> w[1]
'Đ': Unicode U+0110 (category Lu: Letter, uppercase)
julia> w[2]
ERROR: StringIndexError("Điêu", 2)
Stacktrace:
[1] string_index_err(::String, ::Int64) at /nix/store/2fmf5sqi0jx5zdlqx0gpw2m6nrsbcch2-julia-1.0.1/lib/julia/sys.dylib:?
[2] getindex_continued(::String, ::Int64, ::UInt32) at /nix/store/2fmf5sqi0jx5zdlqx0gpw2m6nrsbcch2-julia-1.0.1/lib/julia/sys.dylib:?
[3] getindex(::String, ::Int64) at /nix/store/2fmf5sqi0jx5zdlqx0gpw2m6nrsbcch2-julia-1.0.1/lib/julia/sys.dylib:?
[4] top-level scope at none:0
julia> w[3]
'i': ASCII/Unicode U+0069 (category Ll: Letter, lowercase)
Do chữ Đ
trong Unicode UTF-8 được biểu diễn bằng 2 byte, ta chỉ có thể truy cập được index 1, không truy cập được index 2. Và chữ i
ngay sau Đ
sẽ là index 3.
Exception
TBD
Chú ý
- Julia khởi động mất 0.2-0.4 giây, Python khởi động nhanh gấp 10.
- String trong Julia phải dùng double quote
""
, single quote''
dành cho ký tự (Char). - Nối string dùng
*
chứ không phải+
. - Sẽ không có method gắn liền vào các object như string hay list trong Python, thay vào đó là các function có sẵn (thường không cần import, gọi là trong Base)
Ví dụ 1 chương trình CLI nhận argument, gọi HTTP với JSON
import HTTP
import JSON
using DocOpt # import docopt function
function main()
doc = """Fist Julia program which makes HTTP requests to httpbin endpoint
Usage:
main.jl request <endpoint>
Options:
-h --help Show this screen.
--version Show version.
"""
args = docopt(doc, version=v"0.0.1")
endpoint = args["<endpoint>"]
url = "https://httpbin.org/$endpoint"
println("Accessing $url")
resp = HTTP.get(url)
d = JSON.Parser.parse(String(resp.body))
println("My IP is " * d["origin"])
println("Now also send post")
r = HTTP.request("POST", "https://httpbin.org/post",
["Content-Type" => "application/json"],
JSON.json(Dict('a'=>2, 'b'=>3))
)
data = JSON.Parser.parse(String(r.body))
open("/tmp/data.json", "w") do f
write(f, JSON.json(data["json"]))
end
open("/tmp/data.json", "r") do f
d = JSON.Parser.parse(String(read(f)))
println(d)
end
open(`ls -l`) do io
for line in eachline(io)
if !isa(match(r".*\.jl", line), Nothing)
println(line)
end
end
end
end
main()
Chạy
$ julia main.jl -h
Fist Julia program which makes HTTP requests to httpbin endpoint
Usage:
main.jl request <endpoint>
Options:
-h --help Show this screen.
--version Show version.
$ julia main.jl request ip
Accessing https://httpbin.org/ip
My IP is 3.117.2.254, 3.117.2.254
Now also send post
Dict{String,Any}("b"=>3,"a"=>2)
-rw-r--r-- 1 viethung.nguyen viethung.nguyen 1189 Apr 12 08:38 main.jl
Code hoàn toàn tương đương với code Python.
Kết luận
Còn chờ gì nữa? Làm tí Julia thôi.
Phần tiếp theo (nếu có) sẽ đi vào các tính năng của Julia sử dụng trong tính toán khoa học.
Tham khảo
- https://docs.julialang.org/en/v1/
- https://en.wikibooks.org/wiki/Introducing_Julia
- https://lectures.quantecon.org/jl/
Bài viết gốc được đăng tải tại pp.pymi.vn
Có thể bạn quan tâm:
- G Giải Quyết Bài Toán Kinh Doanh Bằng Big Data và AI
- B BenQ RD Series – Dòng Màn Hình Lập Trình 4k+ Đầu Tiên Trên Thế Giới
- F Framework nào tốt nhất cho dự án của bạn? – Checklist chi tiết
- K Kinh nghiệm xử lý responsive table hiệu quả
- S Stackoverflow là gì? Bí kíp tận dụng Stack Overflow hiệu quả
- 7 7 kinh nghiệm hữu ích khi làm việc với GIT trong dự án
- B Bài tập Python từ cơ bản đến nâng cao (có lời giải)
- B Bảo mật API là gì? Một số nguyên tắc và kỹ thuật cần biết
- H Hướng dẫn cài đặt và tự học lập trình Python cơ bản từ A-Z
- C Chinh Phục Phân Tích Dữ Liệu Với Pandas Trong Python: Hướng Dẫn Từng Bước