Compare commits
	
		
			4 Commits
		
	
	
		
			3aa468c2f6
			...
			adb894869e
		
	
	| Author | SHA1 | Date | |
|---|---|---|---|
| adb894869e | |||
| 1f6032a30e | |||
| 9531f4d8e3 | |||
| 37097d3a40 | 
							
								
								
									
										41
									
								
								code/compiler/08/CMakeLists.txt
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										41
									
								
								code/compiler/08/CMakeLists.txt
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,41 @@ | |||||||
|  | cmake_minimum_required(VERSION 3.1) | ||||||
|  | project(compiler) | ||||||
|  | 
 | ||||||
|  | # Find all the required packages | ||||||
|  | find_package(BISON) | ||||||
|  | find_package(FLEX) | ||||||
|  | find_package(LLVM REQUIRED CONFIG) | ||||||
|  | 
 | ||||||
|  | # Set up the flex and bison targets | ||||||
|  | bison_target(parser | ||||||
|  |     ${CMAKE_CURRENT_SOURCE_DIR}/parser.y | ||||||
|  |     ${CMAKE_CURRENT_BINARY_DIR}/parser.cpp | ||||||
|  |     COMPILE_FLAGS "-d") | ||||||
|  | flex_target(scanner | ||||||
|  |     ${CMAKE_CURRENT_SOURCE_DIR}/scanner.l | ||||||
|  |     ${CMAKE_CURRENT_BINARY_DIR}/scanner.cpp) | ||||||
|  | add_flex_bison_dependency(scanner parser) | ||||||
|  | 
 | ||||||
|  | # Find all the relevant LLVM components | ||||||
|  | llvm_map_components_to_libnames(LLVM_LIBS core x86asmparser x86codegen) | ||||||
|  | 
 | ||||||
|  | # Create compiler executable | ||||||
|  | add_executable(compiler | ||||||
|  |     ast.cpp ast.hpp definition.cpp | ||||||
|  |     type_env.cpp type_env.hpp | ||||||
|  |     env.cpp env.hpp | ||||||
|  |     type.cpp type.hpp | ||||||
|  |     error.cpp error.hpp | ||||||
|  |     binop.cpp binop.hpp | ||||||
|  |     instruction.cpp instruction.hpp | ||||||
|  |     ${BISON_parser_OUTPUTS} | ||||||
|  |     ${FLEX_scanner_OUTPUTS} | ||||||
|  |     main.cpp | ||||||
|  | ) | ||||||
|  | 
 | ||||||
|  | # Configure compiler executable | ||||||
|  | target_include_directories(compiler PUBLIC ${CMAKE_CURRENT_SOURCE_DIR}) | ||||||
|  | target_include_directories(compiler PUBLIC ${CMAKE_CURRENT_BINARY_DIR}) | ||||||
|  | target_include_directories(compiler PUBLIC ${LLVM_DEFINITIONS}) | ||||||
|  | target_compile_definitions(compiler PUBLIC ${LLVM_DEFINITIONS}) | ||||||
|  | target_link_libraries(compiler ${LLVM_LIBS}) | ||||||
							
								
								
									
										262
									
								
								code/compiler/08/ast.cpp
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										262
									
								
								code/compiler/08/ast.cpp
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,262 @@ | |||||||
|  | #include "ast.hpp" | ||||||
|  | #include <ostream> | ||||||
|  | #include "error.hpp" | ||||||
|  | 
 | ||||||
|  | static void print_indent(int n, std::ostream& to) { | ||||||
|  |     while(n--) to << "  "; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | type_ptr ast::typecheck_common(type_mgr& mgr, const type_env& env) { | ||||||
|  |     node_type = typecheck(mgr, env); | ||||||
|  |     return node_type; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void ast::resolve_common(const type_mgr& mgr) { | ||||||
|  |     type_var* var; | ||||||
|  |     type_ptr resolved_type = mgr.resolve(node_type, var); | ||||||
|  |     if(var) throw type_error("ambiguously typed program"); | ||||||
|  | 
 | ||||||
|  |     resolve(mgr); | ||||||
|  |     node_type = std::move(resolved_type); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void ast_int::print(int indent, std::ostream& to) const { | ||||||
|  |     print_indent(indent, to); | ||||||
|  |     to << "INT: " << value << std::endl; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | type_ptr ast_int::typecheck(type_mgr& mgr, const type_env& env) const { | ||||||
|  |     return type_ptr(new type_base("Int")); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void ast_int::resolve(const type_mgr& mgr) const { | ||||||
|  |      | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void ast_int::compile(const env_ptr& env, std::vector<instruction_ptr>& into) const { | ||||||
|  |     into.push_back(instruction_ptr(new instruction_pushint(value))); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void ast_lid::print(int indent, std::ostream& to) const { | ||||||
|  |     print_indent(indent, to); | ||||||
|  |     to << "LID: " << id << std::endl; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | type_ptr ast_lid::typecheck(type_mgr& mgr, const type_env& env) const { | ||||||
|  |     return env.lookup(id); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void ast_lid::resolve(const type_mgr& mgr) const { | ||||||
|  | 
 | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void ast_lid::compile(const env_ptr& env, std::vector<instruction_ptr>& into) const { | ||||||
|  |     into.push_back(instruction_ptr( | ||||||
|  |         env->has_variable(id) ? | ||||||
|  |             (instruction*) new instruction_push(env->get_offset(id)) : | ||||||
|  |             (instruction*) new instruction_pushglobal(id))); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void ast_uid::print(int indent, std::ostream& to) const { | ||||||
|  |     print_indent(indent, to); | ||||||
|  |     to << "UID: " << id << std::endl; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | type_ptr ast_uid::typecheck(type_mgr& mgr, const type_env& env) const { | ||||||
|  |     return env.lookup(id); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void ast_uid::resolve(const type_mgr& mgr) const { | ||||||
|  | 
 | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void ast_uid::compile(const env_ptr& env, std::vector<instruction_ptr>& into) const { | ||||||
|  |     into.push_back(instruction_ptr(new instruction_pushglobal(id))); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void ast_binop::print(int indent, std::ostream& to) const { | ||||||
|  |     print_indent(indent, to); | ||||||
|  |     to << "BINOP: " << op_name(op) << std::endl; | ||||||
|  |     left->print(indent + 1, to); | ||||||
|  |     right->print(indent + 1, to); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | type_ptr ast_binop::typecheck(type_mgr& mgr, const type_env& env) const { | ||||||
|  |     type_ptr ltype = left->typecheck_common(mgr, env); | ||||||
|  |     type_ptr rtype = right->typecheck_common(mgr, env); | ||||||
|  |     type_ptr ftype = env.lookup(op_name(op)); | ||||||
|  |     if(!ftype) throw type_error(std::string("unknown binary operator ") + op_name(op)); | ||||||
|  | 
 | ||||||
|  |     type_ptr return_type = mgr.new_type(); | ||||||
|  |     type_ptr arrow_one = type_ptr(new type_arr(rtype, return_type)); | ||||||
|  |     type_ptr arrow_two = type_ptr(new type_arr(ltype, arrow_one)); | ||||||
|  | 
 | ||||||
|  |     mgr.unify(arrow_two, ftype); | ||||||
|  |     return return_type; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void ast_binop::resolve(const type_mgr& mgr) const { | ||||||
|  |     left->resolve_common(mgr); | ||||||
|  |     right->resolve_common(mgr); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void ast_binop::compile(const env_ptr& env, std::vector<instruction_ptr>& into) const { | ||||||
|  |     right->compile(env, into); | ||||||
|  |     left->compile(env_ptr(new env_offset(1, env)), into); | ||||||
|  | 
 | ||||||
|  |     into.push_back(instruction_ptr(new instruction_pushglobal(op_name(op)))); | ||||||
|  |     into.push_back(instruction_ptr(new instruction_mkapp())); | ||||||
|  |     into.push_back(instruction_ptr(new instruction_mkapp())); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void ast_app::print(int indent, std::ostream& to) const { | ||||||
|  |     print_indent(indent, to); | ||||||
|  |     to << "APP:" << std::endl; | ||||||
|  |     left->print(indent + 1, to); | ||||||
|  |     right->print(indent + 1, to); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | type_ptr ast_app::typecheck(type_mgr& mgr, const type_env& env) const { | ||||||
|  |     type_ptr ltype = left->typecheck_common(mgr, env); | ||||||
|  |     type_ptr rtype = right->typecheck_common(mgr, env); | ||||||
|  | 
 | ||||||
|  |     type_ptr return_type = mgr.new_type(); | ||||||
|  |     type_ptr arrow = type_ptr(new type_arr(rtype, return_type)); | ||||||
|  |     mgr.unify(arrow, ltype); | ||||||
|  |     return return_type; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void ast_app::resolve(const type_mgr& mgr) const { | ||||||
|  |     left->resolve_common(mgr); | ||||||
|  |     right->resolve_common(mgr); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void ast_app::compile(const env_ptr& env, std::vector<instruction_ptr>& into) const { | ||||||
|  |     right->compile(env, into); | ||||||
|  |     left->compile(env_ptr(new env_offset(1, env)), into); | ||||||
|  |     into.push_back(instruction_ptr(new instruction_mkapp())); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void ast_case::print(int indent, std::ostream& to) const { | ||||||
|  |     print_indent(indent, to); | ||||||
|  |     to << "CASE: " << std::endl; | ||||||
|  |     for(auto& branch : branches) { | ||||||
|  |         print_indent(indent + 1, to); | ||||||
|  |         branch->pat->print(to); | ||||||
|  |         to << std::endl; | ||||||
|  |         branch->expr->print(indent + 2, to); | ||||||
|  |     } | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | type_ptr ast_case::typecheck(type_mgr& mgr, const type_env& env) const { | ||||||
|  |     type_var* var; | ||||||
|  |     type_ptr case_type = mgr.resolve(of->typecheck_common(mgr, env), var); | ||||||
|  |     type_ptr branch_type = mgr.new_type(); | ||||||
|  | 
 | ||||||
|  |     for(auto& branch : branches) { | ||||||
|  |         type_env new_env = env.scope(); | ||||||
|  |         branch->pat->match(case_type, mgr, new_env); | ||||||
|  |         type_ptr curr_branch_type = branch->expr->typecheck_common(mgr, new_env); | ||||||
|  |         mgr.unify(branch_type, curr_branch_type); | ||||||
|  |     } | ||||||
|  | 
 | ||||||
|  |     case_type = mgr.resolve(case_type, var); | ||||||
|  |     if(!dynamic_cast<type_data*>(case_type.get())) { | ||||||
|  |         throw type_error("attempting case analysis of non-data type"); | ||||||
|  |     } | ||||||
|  | 
 | ||||||
|  |     return branch_type; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void ast_case::resolve(const type_mgr& mgr) const { | ||||||
|  |     of->resolve_common(mgr); | ||||||
|  |     for(auto& branch : branches) { | ||||||
|  |         branch->expr->resolve_common(mgr); | ||||||
|  |     } | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void ast_case::compile(const env_ptr& env, std::vector<instruction_ptr>& into) const { | ||||||
|  |     type_data* type = dynamic_cast<type_data*>(of->node_type.get()); | ||||||
|  | 
 | ||||||
|  |     of->compile(env, into); | ||||||
|  |     into.push_back(instruction_ptr(new instruction_eval())); | ||||||
|  | 
 | ||||||
|  |     instruction_jump* jump_instruction = new instruction_jump(); | ||||||
|  |     into.push_back(instruction_ptr(jump_instruction)); | ||||||
|  |     for(auto& branch : branches) { | ||||||
|  |         std::vector<instruction_ptr> branch_instructions; | ||||||
|  |         pattern_var* vpat; | ||||||
|  |         pattern_constr* cpat; | ||||||
|  | 
 | ||||||
|  |         if((vpat = dynamic_cast<pattern_var*>(branch->pat.get()))) { | ||||||
|  |             branch->expr->compile(env_ptr(new env_offset(1, env)), branch_instructions); | ||||||
|  | 
 | ||||||
|  |             for(auto& constr_pair : type->constructors) { | ||||||
|  |                 if(jump_instruction->tag_mappings.find(constr_pair.second.tag) != | ||||||
|  |                         jump_instruction->tag_mappings.end()) | ||||||
|  |                     break; | ||||||
|  | 
 | ||||||
|  |                 jump_instruction->tag_mappings[constr_pair.second.tag] = | ||||||
|  |                     jump_instruction->branches.size(); | ||||||
|  |             } | ||||||
|  |             jump_instruction->branches.push_back(std::move(branch_instructions)); | ||||||
|  |         } else if((cpat = dynamic_cast<pattern_constr*>(branch->pat.get()))) { | ||||||
|  |             env_ptr new_env = env; | ||||||
|  |             for(auto it = cpat->params.rbegin(); it != cpat->params.rend(); it++) { | ||||||
|  |                 new_env = env_ptr(new env_var(*it, new_env)); | ||||||
|  |             } | ||||||
|  | 
 | ||||||
|  |             branch_instructions.push_back(instruction_ptr(new instruction_split())); | ||||||
|  |             branch->expr->compile(new_env, branch_instructions); | ||||||
|  |             branch_instructions.push_back(instruction_ptr(new instruction_slide( | ||||||
|  |                             cpat->params.size()))); | ||||||
|  | 
 | ||||||
|  |             int new_tag = type->constructors[cpat->constr].tag; | ||||||
|  |             if(jump_instruction->tag_mappings.find(new_tag) != | ||||||
|  |                     jump_instruction->tag_mappings.end()) | ||||||
|  |                 throw type_error("technically not a type error: duplicate pattern"); | ||||||
|  | 
 | ||||||
|  |             jump_instruction->tag_mappings[new_tag] = | ||||||
|  |                 jump_instruction->branches.size(); | ||||||
|  |             jump_instruction->branches.push_back(std::move(branch_instructions)); | ||||||
|  |         } | ||||||
|  |     } | ||||||
|  | 
 | ||||||
|  |     for(auto& constr_pair : type->constructors) { | ||||||
|  |         if(jump_instruction->tag_mappings.find(constr_pair.second.tag) == | ||||||
|  |                 jump_instruction->tag_mappings.end()) | ||||||
|  |             throw type_error("non-total pattern"); | ||||||
|  |     } | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void pattern_var::print(std::ostream& to) const { | ||||||
|  |     to << var; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void pattern_var::match(type_ptr t, type_mgr& mgr, type_env& env) const { | ||||||
|  |     env.bind(var, t); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void pattern_constr::print(std::ostream& to) const { | ||||||
|  |     to << constr; | ||||||
|  |     for(auto& param : params) { | ||||||
|  |         to << " " << param; | ||||||
|  |     } | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void pattern_constr::match(type_ptr t, type_mgr& mgr, type_env& env) const { | ||||||
|  |     type_ptr constructor_type = env.lookup(constr); | ||||||
|  |     if(!constructor_type) { | ||||||
|  |         throw type_error(std::string("pattern using unknown constructor ") + constr); | ||||||
|  |     } | ||||||
|  | 
 | ||||||
|  |     for(int i = 0; i < params.size(); i++) { | ||||||
|  |         type_arr* arr = dynamic_cast<type_arr*>(constructor_type.get()); | ||||||
|  |         if(!arr) throw type_error("too many parameters in constructor pattern"); | ||||||
|  | 
 | ||||||
|  |         env.bind(params[i], arr->left); | ||||||
|  |         constructor_type = arr->right; | ||||||
|  |     } | ||||||
|  | 
 | ||||||
|  |     mgr.unify(t, constructor_type); | ||||||
|  | } | ||||||
							
								
								
									
										196
									
								
								code/compiler/08/ast.hpp
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										196
									
								
								code/compiler/08/ast.hpp
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,196 @@ | |||||||
|  | #pragma once | ||||||
|  | #include <memory> | ||||||
|  | #include <vector> | ||||||
|  | #include "type.hpp" | ||||||
|  | #include "type_env.hpp" | ||||||
|  | #include "binop.hpp" | ||||||
|  | #include "instruction.hpp" | ||||||
|  | #include "env.hpp" | ||||||
|  | 
 | ||||||
|  | struct ast { | ||||||
|  |     type_ptr node_type; | ||||||
|  | 
 | ||||||
|  |     virtual ~ast() = default; | ||||||
|  | 
 | ||||||
|  |     virtual void print(int indent, std::ostream& to) const = 0; | ||||||
|  |     virtual type_ptr typecheck(type_mgr& mgr, const type_env& env) const = 0; | ||||||
|  |     virtual void resolve(const type_mgr& mgr) const = 0; | ||||||
|  |     virtual void compile(const env_ptr& env, | ||||||
|  |         std::vector<instruction_ptr>& into) const = 0; | ||||||
|  | 
 | ||||||
|  |     type_ptr typecheck_common(type_mgr& mgr, const type_env& env); | ||||||
|  |     void resolve_common(const type_mgr& mgr); | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | using ast_ptr = std::unique_ptr<ast>; | ||||||
|  | 
 | ||||||
|  | struct pattern { | ||||||
|  |     virtual ~pattern() = default; | ||||||
|  | 
 | ||||||
|  |     virtual void print(std::ostream& to) const = 0; | ||||||
|  |     virtual void match(type_ptr t, type_mgr& mgr, type_env& env) const = 0; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | using pattern_ptr = std::unique_ptr<pattern>; | ||||||
|  | 
 | ||||||
|  | struct branch { | ||||||
|  |     pattern_ptr pat; | ||||||
|  |     ast_ptr expr; | ||||||
|  | 
 | ||||||
|  |     branch(pattern_ptr p, ast_ptr a) | ||||||
|  |         : pat(std::move(p)), expr(std::move(a)) {} | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | using branch_ptr = std::unique_ptr<branch>; | ||||||
|  | 
 | ||||||
|  | struct constructor { | ||||||
|  |     std::string name; | ||||||
|  |     std::vector<std::string> types; | ||||||
|  | 
 | ||||||
|  |     constructor(std::string n, std::vector<std::string> ts) | ||||||
|  |         : name(std::move(n)), types(std::move(ts)) {} | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | using constructor_ptr = std::unique_ptr<constructor>; | ||||||
|  | 
 | ||||||
|  | struct definition { | ||||||
|  |     virtual ~definition() = default; | ||||||
|  |      | ||||||
|  |     virtual void typecheck_first(type_mgr& mgr, type_env& env) = 0; | ||||||
|  |     virtual void typecheck_second(type_mgr& mgr, const type_env& env) const = 0; | ||||||
|  |     virtual void resolve(const type_mgr& mgr) = 0; | ||||||
|  |     virtual void compile() = 0; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | using definition_ptr = std::unique_ptr<definition>; | ||||||
|  | 
 | ||||||
|  | struct ast_int : public ast { | ||||||
|  |     int value; | ||||||
|  | 
 | ||||||
|  |     explicit ast_int(int v) | ||||||
|  |         : value(v) {} | ||||||
|  | 
 | ||||||
|  |     void print(int indent, std::ostream& to) const; | ||||||
|  |     type_ptr typecheck(type_mgr& mgr, const type_env& env) const; | ||||||
|  |     void resolve(const type_mgr& mgr) const; | ||||||
|  |     void compile(const env_ptr& env, std::vector<instruction_ptr>& into) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct ast_lid : public ast { | ||||||
|  |     std::string id; | ||||||
|  | 
 | ||||||
|  |     explicit ast_lid(std::string i) | ||||||
|  |         : id(std::move(i)) {} | ||||||
|  | 
 | ||||||
|  |     void print(int indent, std::ostream& to) const; | ||||||
|  |     type_ptr typecheck(type_mgr& mgr, const type_env& env) const; | ||||||
|  |     void resolve(const type_mgr& mgr) const; | ||||||
|  |     void compile(const env_ptr& env, std::vector<instruction_ptr>& into) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct ast_uid : public ast { | ||||||
|  |     std::string id; | ||||||
|  | 
 | ||||||
|  |     explicit ast_uid(std::string i) | ||||||
|  |         : id(std::move(i)) {} | ||||||
|  | 
 | ||||||
|  |     void print(int indent, std::ostream& to) const; | ||||||
|  |     type_ptr typecheck(type_mgr& mgr, const type_env& env) const; | ||||||
|  |     void resolve(const type_mgr& mgr) const; | ||||||
|  |     void compile(const env_ptr& env, std::vector<instruction_ptr>& into) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct ast_binop : public ast { | ||||||
|  |     binop op;   | ||||||
|  |     ast_ptr left; | ||||||
|  |     ast_ptr right; | ||||||
|  | 
 | ||||||
|  |     ast_binop(binop o, ast_ptr l, ast_ptr r) | ||||||
|  |         : op(o), left(std::move(l)), right(std::move(r)) {} | ||||||
|  | 
 | ||||||
|  |     void print(int indent, std::ostream& to) const; | ||||||
|  |     type_ptr typecheck(type_mgr& mgr, const type_env& env) const; | ||||||
|  |     void resolve(const type_mgr& mgr) const; | ||||||
|  |     void compile(const env_ptr& env, std::vector<instruction_ptr>& into) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct ast_app : public ast { | ||||||
|  |     ast_ptr left; | ||||||
|  |     ast_ptr right; | ||||||
|  | 
 | ||||||
|  |     ast_app(ast_ptr l, ast_ptr r) | ||||||
|  |         : left(std::move(l)), right(std::move(r)) {} | ||||||
|  | 
 | ||||||
|  |     void print(int indent, std::ostream& to) const; | ||||||
|  |     type_ptr typecheck(type_mgr& mgr, const type_env& env) const; | ||||||
|  |     void resolve(const type_mgr& mgr) const; | ||||||
|  |     void compile(const env_ptr& env, std::vector<instruction_ptr>& into) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct ast_case : public ast { | ||||||
|  |     ast_ptr of; | ||||||
|  |     std::vector<branch_ptr> branches; | ||||||
|  | 
 | ||||||
|  |     ast_case(ast_ptr o, std::vector<branch_ptr> b) | ||||||
|  |         : of(std::move(o)), branches(std::move(b)) {} | ||||||
|  | 
 | ||||||
|  |     void print(int indent, std::ostream& to) const; | ||||||
|  |     type_ptr typecheck(type_mgr& mgr, const type_env& env) const; | ||||||
|  |     void resolve(const type_mgr& mgr) const; | ||||||
|  |     void compile(const env_ptr& env, std::vector<instruction_ptr>& into) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct pattern_var : public pattern { | ||||||
|  |     std::string var; | ||||||
|  | 
 | ||||||
|  |     pattern_var(std::string v) | ||||||
|  |         : var(std::move(v)) {} | ||||||
|  | 
 | ||||||
|  |     void print(std::ostream &to) const; | ||||||
|  |     void match(type_ptr t, type_mgr& mgr, type_env& env) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct pattern_constr : public pattern { | ||||||
|  |     std::string constr; | ||||||
|  |     std::vector<std::string> params; | ||||||
|  | 
 | ||||||
|  |     pattern_constr(std::string c, std::vector<std::string> p) | ||||||
|  |         : constr(std::move(c)), params(std::move(p)) {} | ||||||
|  | 
 | ||||||
|  |     void print(std::ostream &to) const; | ||||||
|  |     void match(type_ptr t, type_mgr&, type_env& env) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct definition_defn : public definition { | ||||||
|  |     std::string name; | ||||||
|  |     std::vector<std::string> params; | ||||||
|  |     ast_ptr body; | ||||||
|  | 
 | ||||||
|  |     type_ptr return_type; | ||||||
|  |     std::vector<type_ptr> param_types; | ||||||
|  | 
 | ||||||
|  |     std::vector<instruction_ptr> instructions; | ||||||
|  | 
 | ||||||
|  |     definition_defn(std::string n, std::vector<std::string> p, ast_ptr b) | ||||||
|  |         : name(std::move(n)), params(std::move(p)), body(std::move(b)) { | ||||||
|  | 
 | ||||||
|  |     } | ||||||
|  | 
 | ||||||
|  |     void typecheck_first(type_mgr& mgr, type_env& env); | ||||||
|  |     void typecheck_second(type_mgr& mgr, const type_env& env) const; | ||||||
|  |     void resolve(const type_mgr& mgr); | ||||||
|  |     void compile(); | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct definition_data : public definition { | ||||||
|  |     std::string name; | ||||||
|  |     std::vector<constructor_ptr> constructors; | ||||||
|  | 
 | ||||||
|  |     definition_data(std::string n, std::vector<constructor_ptr> cs) | ||||||
|  |         : name(std::move(n)), constructors(std::move(cs)) {} | ||||||
|  | 
 | ||||||
|  |     void typecheck_first(type_mgr& mgr, type_env& env); | ||||||
|  |     void typecheck_second(type_mgr& mgr, const type_env& env) const; | ||||||
|  |     void resolve(const type_mgr& mgr); | ||||||
|  |     void compile(); | ||||||
|  | }; | ||||||
							
								
								
									
										21
									
								
								code/compiler/08/binop.cpp
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										21
									
								
								code/compiler/08/binop.cpp
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,21 @@ | |||||||
|  | #include "binop.hpp" | ||||||
|  | 
 | ||||||
|  | std::string op_name(binop op) { | ||||||
|  |     switch(op) { | ||||||
|  |         case PLUS: return "+"; | ||||||
|  |         case MINUS: return "-"; | ||||||
|  |         case TIMES: return "*"; | ||||||
|  |         case DIVIDE: return "/"; | ||||||
|  |     } | ||||||
|  |     return "??"; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | std::string op_action(binop op) { | ||||||
|  |     switch(op) { | ||||||
|  |         case PLUS: return "plus"; | ||||||
|  |         case MINUS: return "minus"; | ||||||
|  |         case TIMES: return "times"; | ||||||
|  |         case DIVIDE: return "divide"; | ||||||
|  |     } | ||||||
|  |     return "??"; | ||||||
|  | } | ||||||
							
								
								
									
										12
									
								
								code/compiler/08/binop.hpp
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										12
									
								
								code/compiler/08/binop.hpp
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,12 @@ | |||||||
|  | #pragma once | ||||||
|  | #include <string> | ||||||
|  | 
 | ||||||
|  | enum binop { | ||||||
|  |     PLUS, | ||||||
|  |     MINUS, | ||||||
|  |     TIMES, | ||||||
|  |     DIVIDE | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | std::string op_name(binop op); | ||||||
|  | std::string op_action(binop op); | ||||||
							
								
								
									
										81
									
								
								code/compiler/08/definition.cpp
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										81
									
								
								code/compiler/08/definition.cpp
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,81 @@ | |||||||
|  | #include "ast.hpp" | ||||||
|  | #include "error.hpp" | ||||||
|  | 
 | ||||||
|  | void definition_defn::typecheck_first(type_mgr& mgr, type_env& env) { | ||||||
|  |     return_type = mgr.new_type(); | ||||||
|  |     type_ptr full_type = return_type; | ||||||
|  | 
 | ||||||
|  |     for(auto it = params.rbegin(); it != params.rend(); it++) { | ||||||
|  |         type_ptr param_type = mgr.new_type(); | ||||||
|  |         full_type = type_ptr(new type_arr(param_type, full_type)); | ||||||
|  |         param_types.push_back(param_type); | ||||||
|  |     } | ||||||
|  | 
 | ||||||
|  |     env.bind(name, full_type); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void definition_defn::typecheck_second(type_mgr& mgr, const type_env& env) const { | ||||||
|  |     type_env new_env = env.scope(); | ||||||
|  |     auto param_it = params.begin(); | ||||||
|  |     auto type_it = param_types.rbegin(); | ||||||
|  | 
 | ||||||
|  |     while(param_it != params.end() && type_it != param_types.rend()) { | ||||||
|  |         new_env.bind(*param_it, *type_it); | ||||||
|  |         param_it++; | ||||||
|  |         type_it++; | ||||||
|  |     } | ||||||
|  | 
 | ||||||
|  |     type_ptr body_type = body->typecheck_common(mgr, new_env); | ||||||
|  |     mgr.unify(return_type, body_type); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void definition_defn::resolve(const type_mgr& mgr) { | ||||||
|  |     type_var* var; | ||||||
|  |     body->resolve_common(mgr); | ||||||
|  | 
 | ||||||
|  |     return_type = mgr.resolve(return_type, var); | ||||||
|  |     if(var) throw type_error("ambiguously typed program"); | ||||||
|  |     for(auto& param_type : param_types) { | ||||||
|  |         param_type = mgr.resolve(param_type, var); | ||||||
|  |         if(var) throw type_error("ambiguously typed program"); | ||||||
|  |     } | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void definition_defn::compile() { | ||||||
|  |     env_ptr new_env = env_ptr(new env_offset(0, nullptr)); | ||||||
|  |     for(auto it = params.rbegin(); it != params.rend(); it++) { | ||||||
|  |         new_env = env_ptr(new env_var(*it, new_env)); | ||||||
|  |     } | ||||||
|  |     body->compile(new_env, instructions); | ||||||
|  |     instructions.push_back(instruction_ptr(new instruction_update(params.size()))); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void definition_data::typecheck_first(type_mgr& mgr, type_env& env) { | ||||||
|  |     type_data* this_type = new type_data(name); | ||||||
|  |     type_ptr return_type = type_ptr(this_type); | ||||||
|  |     int next_tag = 0; | ||||||
|  | 
 | ||||||
|  |     for(auto& constructor : constructors) { | ||||||
|  |         this_type->constructors[constructor->name] = { next_tag++ }; | ||||||
|  | 
 | ||||||
|  |         type_ptr full_type = return_type; | ||||||
|  |         for(auto it = constructor->types.rbegin(); it != constructor->types.rend(); it++) { | ||||||
|  |             type_ptr type = type_ptr(new type_base(*it)); | ||||||
|  |             full_type = type_ptr(new type_arr(type, full_type)); | ||||||
|  |         } | ||||||
|  | 
 | ||||||
|  |         env.bind(constructor->name, full_type); | ||||||
|  |     } | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void definition_data::typecheck_second(type_mgr& mgr, const type_env& env) const { | ||||||
|  |     // Nothing
 | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void definition_data::resolve(const type_mgr& mgr) { | ||||||
|  |     // Nothing
 | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void definition_data::compile() { | ||||||
|  | 
 | ||||||
|  | } | ||||||
							
								
								
									
										23
									
								
								code/compiler/08/env.cpp
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										23
									
								
								code/compiler/08/env.cpp
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,23 @@ | |||||||
|  | #include "env.hpp" | ||||||
|  | 
 | ||||||
|  | int env_var::get_offset(const std::string& name) const { | ||||||
|  |     if(name == this->name) return 0; | ||||||
|  |     if(parent) return parent->get_offset(name) + 1; | ||||||
|  |     throw 0; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | bool env_var::has_variable(const std::string& name) const { | ||||||
|  |     if(name == this->name) return true; | ||||||
|  |     if(parent) return parent->has_variable(name); | ||||||
|  |     return false; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | int env_offset::get_offset(const std::string& name) const { | ||||||
|  |     if(parent) return parent->get_offset(name) + offset; | ||||||
|  |     throw 0; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | bool env_offset::has_variable(const std::string& name) const { | ||||||
|  |     if(parent) return parent->has_variable(name); | ||||||
|  |     return false; | ||||||
|  | } | ||||||
							
								
								
									
										34
									
								
								code/compiler/08/env.hpp
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										34
									
								
								code/compiler/08/env.hpp
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,34 @@ | |||||||
|  | #pragma once | ||||||
|  | #include <memory> | ||||||
|  | #include <string> | ||||||
|  | 
 | ||||||
|  | struct env { | ||||||
|  |     virtual ~env() = default; | ||||||
|  | 
 | ||||||
|  |     virtual int get_offset(const std::string& name) const = 0; | ||||||
|  |     virtual bool has_variable(const std::string& name) const = 0; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | using env_ptr = std::shared_ptr<env>; | ||||||
|  | 
 | ||||||
|  | struct env_var : public env { | ||||||
|  |     std::string name; | ||||||
|  |     env_ptr parent; | ||||||
|  | 
 | ||||||
|  |     env_var(std::string& n, env_ptr p) | ||||||
|  |         : name(std::move(n)), parent(std::move(p)) {} | ||||||
|  | 
 | ||||||
|  |     int get_offset(const std::string& name) const; | ||||||
|  |     bool has_variable(const std::string& name) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct env_offset : public env { | ||||||
|  |     int offset; | ||||||
|  |     env_ptr parent; | ||||||
|  | 
 | ||||||
|  |     env_offset(int o, env_ptr p) | ||||||
|  |         : offset(o), parent(std::move(p)) {} | ||||||
|  | 
 | ||||||
|  |     int get_offset(const std::string& name) const; | ||||||
|  |     bool has_variable(const std::string& name) const; | ||||||
|  | }; | ||||||
							
								
								
									
										5
									
								
								code/compiler/08/error.cpp
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										5
									
								
								code/compiler/08/error.cpp
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,5 @@ | |||||||
|  | #include "error.hpp" | ||||||
|  | 
 | ||||||
|  | const char* type_error::what() const noexcept { | ||||||
|  |     return "an error occured while checking the types of the program"; | ||||||
|  | } | ||||||
							
								
								
									
										21
									
								
								code/compiler/08/error.hpp
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										21
									
								
								code/compiler/08/error.hpp
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,21 @@ | |||||||
|  | #pragma once | ||||||
|  | #include <exception> | ||||||
|  | #include "type.hpp" | ||||||
|  | 
 | ||||||
|  | struct type_error : std::exception { | ||||||
|  |     std::string description; | ||||||
|  | 
 | ||||||
|  |     type_error(std::string d) | ||||||
|  |         : description(std::move(d)) {} | ||||||
|  | 
 | ||||||
|  |     const char* what() const noexcept override; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct unification_error : public type_error { | ||||||
|  |     type_ptr left; | ||||||
|  |     type_ptr right; | ||||||
|  | 
 | ||||||
|  |     unification_error(type_ptr l, type_ptr r) | ||||||
|  |         : left(std::move(l)), right(std::move(r)),  | ||||||
|  |             type_error("failed to unify types") {} | ||||||
|  | }; | ||||||
							
								
								
									
										2
									
								
								code/compiler/08/examples/bad1.txt
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										2
									
								
								code/compiler/08/examples/bad1.txt
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,2 @@ | |||||||
|  | data Bool = { True, False } | ||||||
|  | defn main = { 3 + True } | ||||||
							
								
								
									
										1
									
								
								code/compiler/08/examples/bad2.txt
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										1
									
								
								code/compiler/08/examples/bad2.txt
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1 @@ | |||||||
|  | defn main = { 1 2 3 4 5 } | ||||||
							
								
								
									
										8
									
								
								code/compiler/08/examples/bad3.txt
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										8
									
								
								code/compiler/08/examples/bad3.txt
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,8 @@ | |||||||
|  | data List = { Nil, Cons Int List } | ||||||
|  | 
 | ||||||
|  | defn head l = { | ||||||
|  |     case l of { | ||||||
|  |         Nil -> { 0 } | ||||||
|  |         Cons x y z -> { x } | ||||||
|  |     } | ||||||
|  | } | ||||||
							
								
								
									
										31
									
								
								code/compiler/08/examples/runtime1.c
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										31
									
								
								code/compiler/08/examples/runtime1.c
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,31 @@ | |||||||
|  | #include "../runtime.h" | ||||||
|  | 
 | ||||||
|  | void f_add(struct stack* s) { | ||||||
|  |     struct node_num* left = (struct node_num*) eval(stack_peek(s, 0)); | ||||||
|  |     struct node_num* right = (struct node_num*) eval(stack_peek(s, 1)); | ||||||
|  |     stack_push(s, (struct node_base*) alloc_num(left->value + right->value)); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void f_main(struct stack* s) { | ||||||
|  |     // PushInt 320
 | ||||||
|  |     stack_push(s, (struct node_base*) alloc_num(320)); | ||||||
|  | 
 | ||||||
|  |     // PushInt 6
 | ||||||
|  |     stack_push(s, (struct node_base*) alloc_num(6)); | ||||||
|  | 
 | ||||||
|  |     // PushGlobal f_add (the function for +)
 | ||||||
|  |     stack_push(s, (struct node_base*) alloc_global(f_add, 2)); | ||||||
|  | 
 | ||||||
|  |     struct node_base* left; | ||||||
|  |     struct node_base* right; | ||||||
|  |      | ||||||
|  |     // MkApp
 | ||||||
|  |     left = stack_pop(s); | ||||||
|  |     right = stack_pop(s); | ||||||
|  |     stack_push(s, (struct node_base*) alloc_app(left, right)); | ||||||
|  |      | ||||||
|  |     // MkApp
 | ||||||
|  |     left = stack_pop(s); | ||||||
|  |     right = stack_pop(s); | ||||||
|  |     stack_push(s, (struct node_base*) alloc_app(left, right)); | ||||||
|  | } | ||||||
							
								
								
									
										2
									
								
								code/compiler/08/examples/works1.txt
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										2
									
								
								code/compiler/08/examples/works1.txt
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,2 @@ | |||||||
|  | defn main = { plus 320 6 } | ||||||
|  | defn plus x y = { x + y } | ||||||
							
								
								
									
										3
									
								
								code/compiler/08/examples/works2.txt
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										3
									
								
								code/compiler/08/examples/works2.txt
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,3 @@ | |||||||
|  | defn add x y = { x + y } | ||||||
|  | defn double x = { add x x } | ||||||
|  | defn main = { double 163 } | ||||||
							
								
								
									
										7
									
								
								code/compiler/08/examples/works3.txt
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										7
									
								
								code/compiler/08/examples/works3.txt
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,7 @@ | |||||||
|  | data List = { Nil, Cons Int List } | ||||||
|  | defn length l = { | ||||||
|  |     case l of { | ||||||
|  |         Nil -> { 0 } | ||||||
|  |         Cons x xs -> { 1 + length xs } | ||||||
|  |     } | ||||||
|  | } | ||||||
							
								
								
									
										78
									
								
								code/compiler/08/instruction.cpp
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										78
									
								
								code/compiler/08/instruction.cpp
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,78 @@ | |||||||
|  | #include "instruction.hpp" | ||||||
|  | 
 | ||||||
|  | static void print_indent(int n, std::ostream& to) { | ||||||
|  |     while(n--) to << "  "; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void instruction_pushint::print(int indent, std::ostream& to) const { | ||||||
|  |     print_indent(indent, to); | ||||||
|  |     to << "PushInt(" << value << ")" << std::endl; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void instruction_pushglobal::print(int indent, std::ostream& to) const { | ||||||
|  |     print_indent(indent, to); | ||||||
|  |     to << "PushGlobal(" << name << ")" << std::endl; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void instruction_push::print(int indent, std::ostream& to) const { | ||||||
|  |     print_indent(indent, to); | ||||||
|  |     to << "Push(" << offset << ")" << std::endl; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void instruction_mkapp::print(int indent, std::ostream& to) const { | ||||||
|  |     print_indent(indent, to); | ||||||
|  |     to << "MkApp()" << std::endl; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void instruction_update::print(int indent, std::ostream& to) const { | ||||||
|  |     print_indent(indent, to); | ||||||
|  |     to << "Update(" << offset << ")" << std::endl; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void instruction_pack::print(int indent, std::ostream& to) const { | ||||||
|  |     print_indent(indent, to); | ||||||
|  |     to << "Pack(" << tag << ", " << size << ")" << std::endl; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void instruction_split::print(int indent, std::ostream& to) const { | ||||||
|  |     print_indent(indent, to); | ||||||
|  |     to << "Split()" << std::endl; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void instruction_jump::print(int indent, std::ostream& to) const { | ||||||
|  |     print_indent(indent, to); | ||||||
|  |     to << "Jump(" << std::endl; | ||||||
|  |     for(auto& instruction_set : branches) { | ||||||
|  |         for(auto& instruction : instruction_set) { | ||||||
|  |             instruction->print(indent + 2, to); | ||||||
|  |         } | ||||||
|  |         to << std::endl; | ||||||
|  |     } | ||||||
|  |     print_indent(indent, to); | ||||||
|  |     to << ")" << std::endl; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void instruction_slide::print(int indent, std::ostream& to) const { | ||||||
|  |     print_indent(indent, to); | ||||||
|  |     to << "Slide(" << offset << ")" << std::endl; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void instruction_binop::print(int indent, std::ostream& to) const { | ||||||
|  |     print_indent(indent, to); | ||||||
|  |     to << "BinOp(" << op_action(op) << ")" << std::endl; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void instruction_eval::print(int indent, std::ostream& to) const { | ||||||
|  |     print_indent(indent, to); | ||||||
|  |     to << "Eval()" << std::endl; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void instruction_alloc::print(int indent, std::ostream& to) const { | ||||||
|  |     print_indent(indent, to); | ||||||
|  |     to << "Alloc(" << amount << ")" << std::endl; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void instruction_unwind::print(int indent, std::ostream& to) const { | ||||||
|  |     print_indent(indent, to); | ||||||
|  |     to << "Unwind()" << std::endl; | ||||||
|  | } | ||||||
							
								
								
									
										111
									
								
								code/compiler/08/instruction.hpp
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										111
									
								
								code/compiler/08/instruction.hpp
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,111 @@ | |||||||
|  | #pragma once | ||||||
|  | #include <string> | ||||||
|  | #include <memory> | ||||||
|  | #include <vector> | ||||||
|  | #include <map> | ||||||
|  | #include <ostream> | ||||||
|  | #include "binop.hpp" | ||||||
|  | 
 | ||||||
|  | struct instruction { | ||||||
|  |     virtual ~instruction() = default; | ||||||
|  | 
 | ||||||
|  |     virtual void print(int indent, std::ostream& to) const = 0; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | using instruction_ptr = std::unique_ptr<instruction>; | ||||||
|  | 
 | ||||||
|  | struct instruction_pushint : public instruction { | ||||||
|  |     int value; | ||||||
|  | 
 | ||||||
|  |     instruction_pushint(int v) | ||||||
|  |         : value(v) {} | ||||||
|  | 
 | ||||||
|  |     void print(int indent, std::ostream& to) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct instruction_pushglobal : public instruction { | ||||||
|  |     std::string name; | ||||||
|  | 
 | ||||||
|  |     instruction_pushglobal(std::string n) | ||||||
|  |         : name(std::move(n)) {} | ||||||
|  | 
 | ||||||
|  |     void print(int indent, std::ostream& to) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct instruction_push : public instruction { | ||||||
|  |     int offset; | ||||||
|  | 
 | ||||||
|  |     instruction_push(int o) | ||||||
|  |         : offset(o) {} | ||||||
|  | 
 | ||||||
|  |     void print(int indent, std::ostream& to) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct instruction_mkapp : public instruction { | ||||||
|  |     void print(int indent, std::ostream& to) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct instruction_update : public instruction { | ||||||
|  |     int offset; | ||||||
|  | 
 | ||||||
|  |     instruction_update(int o) | ||||||
|  |         : offset(o) {} | ||||||
|  | 
 | ||||||
|  |     void print(int indent, std::ostream& to) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct instruction_pack : public instruction { | ||||||
|  |     int tag; | ||||||
|  |     int size; | ||||||
|  | 
 | ||||||
|  |     instruction_pack(int t, int s) | ||||||
|  |         : tag(t), size(s) {} | ||||||
|  | 
 | ||||||
|  |     void print(int indent, std::ostream& to) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct instruction_split : public instruction { | ||||||
|  |     void print(int indent, std::ostream& to) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct instruction_jump : public instruction { | ||||||
|  |     std::vector<std::vector<instruction_ptr>> branches; | ||||||
|  |     std::map<int, int> tag_mappings; | ||||||
|  | 
 | ||||||
|  |     void print(int indent, std::ostream& to) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct instruction_slide : public instruction { | ||||||
|  |     int offset; | ||||||
|  | 
 | ||||||
|  |     instruction_slide(int o) | ||||||
|  |         : offset(o) {} | ||||||
|  | 
 | ||||||
|  |     void print(int indent, std::ostream& to) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct instruction_binop : public instruction { | ||||||
|  |     binop op; | ||||||
|  | 
 | ||||||
|  |     instruction_binop(binop o) | ||||||
|  |         : op(o) {} | ||||||
|  | 
 | ||||||
|  |     void print(int indent, std::ostream& to) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct instruction_eval : public instruction { | ||||||
|  |     void print(int indent, std::ostream& to) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct instruction_alloc : public instruction { | ||||||
|  |     int amount; | ||||||
|  | 
 | ||||||
|  |     instruction_alloc(int a) | ||||||
|  |         : amount(a) {} | ||||||
|  | 
 | ||||||
|  |     void print(int indent, std::ostream& to) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct instruction_unwind : public instruction { | ||||||
|  |     void print(int indent, std::ostream& to) const; | ||||||
|  | }; | ||||||
							
								
								
									
										18
									
								
								code/compiler/08/llvm_context.cpp
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										18
									
								
								code/compiler/08/llvm_context.cpp
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,18 @@ | |||||||
|  | #include "llvm_context.hpp" | ||||||
|  | #include <llvm/IR/DerivedTypes.h> | ||||||
|  | 
 | ||||||
|  | void llvm_state::create_types() { | ||||||
|  |     stack_type = llvm::StructType::create(ctx, "stack"); | ||||||
|  |     tag_type = llvm::IntegerType::getInt8Ty(ctx); | ||||||
|  |     struct_types["node_base"] = llvm::StructType::create(ctx, "node_base"); | ||||||
|  |     struct_types["node_app"] = llvm::StructType::create(ctx, "node_app"); | ||||||
|  |     struct_types["node_num"] = llvm::StructType::create(ctx, "node_num"); | ||||||
|  |     struct_types["node_global"] = llvm::StructType::create(ctx, "node_global"); | ||||||
|  |     struct_types["node_ind"] = llvm::StructType::create(ctx, "node_ind"); | ||||||
|  |     struct_types["node_data"] = llvm::StructType::create(ctx, "node_data"); | ||||||
|  |     node_ptr_type = llvm::PointerType::getUnqual(struct_types.at("node_base")); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void llvm_state::create_functions() { | ||||||
|  |      | ||||||
|  | } | ||||||
							
								
								
									
										29
									
								
								code/compiler/08/llvm_context.hpp
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										29
									
								
								code/compiler/08/llvm_context.hpp
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,29 @@ | |||||||
|  | #pragma once | ||||||
|  | #include <llvm/IR/DerivedTypes.h> | ||||||
|  | #include <llvm/IR/Function.h> | ||||||
|  | #include <llvm/IR/LLVMContext.h> | ||||||
|  | #include <llvm/IR/IRBuilder.h> | ||||||
|  | #include <llvm/IR/Module.h> | ||||||
|  | #include <map> | ||||||
|  | 
 | ||||||
|  | struct llvm_state { | ||||||
|  |     llvm::LLVMContext ctx; | ||||||
|  |     llvm::IRBuilder<> builder; | ||||||
|  |     llvm::Module module; | ||||||
|  | 
 | ||||||
|  |     std::map<std::string, llvm::Function*> functions; | ||||||
|  |     std::map<std::string, llvm::StructType*> struct_types; | ||||||
|  | 
 | ||||||
|  |     llvm::StructType* stack_type; | ||||||
|  |     llvm::PointerType* node_ptr_type; | ||||||
|  |     llvm::IntegerType* tag_type; | ||||||
|  | 
 | ||||||
|  |     llvm_state() | ||||||
|  |         : builder(ctx), module("bloglang", ctx) { | ||||||
|  |         create_types(); | ||||||
|  |         create_functions(); | ||||||
|  |     } | ||||||
|  | 
 | ||||||
|  |     void create_types(); | ||||||
|  |     void create_functions(); | ||||||
|  | }; | ||||||
							
								
								
									
										88
									
								
								code/compiler/08/main.cpp
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										88
									
								
								code/compiler/08/main.cpp
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,88 @@ | |||||||
|  | #include "ast.hpp" | ||||||
|  | #include <iostream> | ||||||
|  | #include "parser.hpp" | ||||||
|  | #include "error.hpp" | ||||||
|  | #include "type.hpp" | ||||||
|  | 
 | ||||||
|  | void yy::parser::error(const std::string& msg) { | ||||||
|  |     std::cout << "An error occured: " << msg << std::endl; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | extern std::vector<definition_ptr> program; | ||||||
|  | 
 | ||||||
|  | void typecheck_program( | ||||||
|  |         const std::vector<definition_ptr>& prog, | ||||||
|  |         type_mgr& mgr, type_env& env) { | ||||||
|  |     type_ptr int_type = type_ptr(new type_base("Int"));  | ||||||
|  |     type_ptr binop_type = type_ptr(new type_arr( | ||||||
|  |                 int_type, | ||||||
|  |                 type_ptr(new type_arr(int_type, int_type)))); | ||||||
|  | 
 | ||||||
|  |     env.bind("+", binop_type); | ||||||
|  |     env.bind("-", binop_type); | ||||||
|  |     env.bind("*", binop_type); | ||||||
|  |     env.bind("/", binop_type); | ||||||
|  | 
 | ||||||
|  |     for(auto& def : prog) { | ||||||
|  |         def->typecheck_first(mgr, env); | ||||||
|  |     } | ||||||
|  | 
 | ||||||
|  |     for(auto& def : prog) { | ||||||
|  |         def->typecheck_second(mgr, env); | ||||||
|  |     } | ||||||
|  | 
 | ||||||
|  |     for(auto& pair : env.names) { | ||||||
|  |         std::cout << pair.first << ": "; | ||||||
|  |         pair.second->print(mgr, std::cout); | ||||||
|  |         std::cout << std::endl; | ||||||
|  |     } | ||||||
|  | 
 | ||||||
|  |     for(auto& def : prog) { | ||||||
|  |         def->resolve(mgr); | ||||||
|  |     } | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void compile_program(const std::vector<definition_ptr>& prog) { | ||||||
|  |     for(auto& def : prog) { | ||||||
|  |         def->compile(); | ||||||
|  | 
 | ||||||
|  |         definition_defn* defn = dynamic_cast<definition_defn*>(def.get()); | ||||||
|  |         if(!defn) continue; | ||||||
|  |         for(auto& instruction : defn->instructions) { | ||||||
|  |             instruction->print(0, std::cout); | ||||||
|  |         } | ||||||
|  |         std::cout << std::endl; | ||||||
|  |     } | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | int main() { | ||||||
|  |     yy::parser parser; | ||||||
|  |     type_mgr mgr; | ||||||
|  |     type_env env; | ||||||
|  | 
 | ||||||
|  |     parser.parse(); | ||||||
|  |     for(auto& definition : program) { | ||||||
|  |         definition_defn* def = dynamic_cast<definition_defn*>(definition.get()); | ||||||
|  |         if(!def) continue; | ||||||
|  | 
 | ||||||
|  |         std::cout << def->name; | ||||||
|  |         for(auto& param : def->params) std::cout << " " << param; | ||||||
|  |         std::cout << ":" << std::endl; | ||||||
|  | 
 | ||||||
|  |         def->body->print(1, std::cout); | ||||||
|  |     } | ||||||
|  |     try { | ||||||
|  |         typecheck_program(program, mgr, env); | ||||||
|  |         compile_program(program); | ||||||
|  |     } catch(unification_error& err) { | ||||||
|  |         std::cout << "failed to unify types: " << std::endl; | ||||||
|  |         std::cout << "  (1) \033[34m"; | ||||||
|  |         err.left->print(mgr, std::cout); | ||||||
|  |         std::cout << "\033[0m" << std::endl; | ||||||
|  |         std::cout << "  (2) \033[32m"; | ||||||
|  |         err.right->print(mgr, std::cout); | ||||||
|  |         std::cout << "\033[0m" << std::endl; | ||||||
|  |     } catch(type_error& err) { | ||||||
|  |         std::cout << "failed to type check program: " << err.description << std::endl; | ||||||
|  |     } | ||||||
|  | } | ||||||
							
								
								
									
										140
									
								
								code/compiler/08/parser.y
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										140
									
								
								code/compiler/08/parser.y
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,140 @@ | |||||||
|  | %{ | ||||||
|  | #include <string> | ||||||
|  | #include <iostream> | ||||||
|  | #include "ast.hpp" | ||||||
|  | #include "parser.hpp" | ||||||
|  | 
 | ||||||
|  | std::vector<definition_ptr> program; | ||||||
|  | extern yy::parser::symbol_type yylex(); | ||||||
|  | 
 | ||||||
|  | %} | ||||||
|  | 
 | ||||||
|  | %token PLUS | ||||||
|  | %token TIMES | ||||||
|  | %token MINUS | ||||||
|  | %token DIVIDE | ||||||
|  | %token <int> INT | ||||||
|  | %token DEFN | ||||||
|  | %token DATA | ||||||
|  | %token CASE | ||||||
|  | %token OF | ||||||
|  | %token OCURLY | ||||||
|  | %token CCURLY | ||||||
|  | %token OPAREN | ||||||
|  | %token CPAREN | ||||||
|  | %token COMMA | ||||||
|  | %token ARROW | ||||||
|  | %token EQUAL | ||||||
|  | %token <std::string> LID | ||||||
|  | %token <std::string> UID | ||||||
|  | 
 | ||||||
|  | %language "c++" | ||||||
|  | %define api.value.type variant | ||||||
|  | %define api.token.constructor | ||||||
|  | 
 | ||||||
|  | %type <std::vector<std::string>> lowercaseParams uppercaseParams | ||||||
|  | %type <std::vector<definition_ptr>> program definitions | ||||||
|  | %type <std::vector<branch_ptr>> branches | ||||||
|  | %type <std::vector<constructor_ptr>> constructors | ||||||
|  | %type <ast_ptr> aAdd aMul case app appBase | ||||||
|  | %type <definition_ptr> definition defn data  | ||||||
|  | %type <branch_ptr> branch | ||||||
|  | %type <pattern_ptr> pattern | ||||||
|  | %type <constructor_ptr> constructor | ||||||
|  | 
 | ||||||
|  | %start program | ||||||
|  | 
 | ||||||
|  | %% | ||||||
|  | 
 | ||||||
|  | program | ||||||
|  |     : definitions { program = std::move($1); } | ||||||
|  |     ; | ||||||
|  | 
 | ||||||
|  | definitions | ||||||
|  |     : definitions definition { $$ = std::move($1); $$.push_back(std::move($2)); } | ||||||
|  |     | definition { $$ = std::vector<definition_ptr>(); $$.push_back(std::move($1)); } | ||||||
|  |     ; | ||||||
|  | 
 | ||||||
|  | definition | ||||||
|  |     : defn { $$ = std::move($1); } | ||||||
|  |     | data { $$ = std::move($1); } | ||||||
|  |     ; | ||||||
|  | 
 | ||||||
|  | defn | ||||||
|  |     : DEFN LID lowercaseParams EQUAL OCURLY aAdd CCURLY | ||||||
|  |         { $$ = definition_ptr( | ||||||
|  |             new definition_defn(std::move($2), std::move($3), std::move($6))); } | ||||||
|  |     ; | ||||||
|  | 
 | ||||||
|  | lowercaseParams | ||||||
|  |     : %empty { $$ = std::vector<std::string>(); } | ||||||
|  |     | lowercaseParams LID { $$ = std::move($1); $$.push_back(std::move($2)); } | ||||||
|  |     ; | ||||||
|  | 
 | ||||||
|  | uppercaseParams | ||||||
|  |     : %empty { $$ = std::vector<std::string>(); } | ||||||
|  |     | uppercaseParams UID { $$ = std::move($1); $$.push_back(std::move($2)); } | ||||||
|  |     ; | ||||||
|  | 
 | ||||||
|  | aAdd | ||||||
|  |     : aAdd PLUS aMul { $$ = ast_ptr(new ast_binop(PLUS, std::move($1), std::move($3))); } | ||||||
|  |     | aAdd MINUS aMul { $$ = ast_ptr(new ast_binop(MINUS, std::move($1), std::move($3))); } | ||||||
|  |     | aMul { $$ = std::move($1); } | ||||||
|  |     ; | ||||||
|  | 
 | ||||||
|  | aMul | ||||||
|  |     : aMul TIMES app { $$ = ast_ptr(new ast_binop(TIMES, std::move($1), std::move($3))); } | ||||||
|  |     | aMul DIVIDE app { $$ = ast_ptr(new ast_binop(DIVIDE, std::move($1), std::move($3))); } | ||||||
|  |     | app { $$ = std::move($1); } | ||||||
|  |     ; | ||||||
|  | 
 | ||||||
|  | app | ||||||
|  |     : app appBase { $$ = ast_ptr(new ast_app(std::move($1), std::move($2))); } | ||||||
|  |     | appBase { $$ = std::move($1); } | ||||||
|  |     ; | ||||||
|  | 
 | ||||||
|  | appBase | ||||||
|  |     : INT { $$ = ast_ptr(new ast_int($1)); } | ||||||
|  |     | LID { $$ = ast_ptr(new ast_lid(std::move($1))); } | ||||||
|  |     | UID { $$ = ast_ptr(new ast_uid(std::move($1))); } | ||||||
|  |     | OPAREN aAdd CPAREN { $$ = std::move($2); } | ||||||
|  |     | case { $$ = std::move($1); } | ||||||
|  |     ; | ||||||
|  | 
 | ||||||
|  | case | ||||||
|  |     : CASE aAdd OF OCURLY branches CCURLY  | ||||||
|  |         { $$ = ast_ptr(new ast_case(std::move($2), std::move($5))); } | ||||||
|  |     ; | ||||||
|  | 
 | ||||||
|  | branches | ||||||
|  |     : branches branch { $$ = std::move($1); $$.push_back(std::move($2)); } | ||||||
|  |     | branch { $$ = std::vector<branch_ptr>(); $$.push_back(std::move($1));} | ||||||
|  |     ; | ||||||
|  | 
 | ||||||
|  | branch | ||||||
|  |     : pattern ARROW OCURLY aAdd CCURLY | ||||||
|  |         { $$ = branch_ptr(new branch(std::move($1), std::move($4))); } | ||||||
|  |     ; | ||||||
|  | 
 | ||||||
|  | pattern | ||||||
|  |     : LID { $$ = pattern_ptr(new pattern_var(std::move($1))); } | ||||||
|  |     | UID lowercaseParams | ||||||
|  |         { $$ = pattern_ptr(new pattern_constr(std::move($1), std::move($2))); } | ||||||
|  |     ; | ||||||
|  | 
 | ||||||
|  | data | ||||||
|  |     : DATA UID EQUAL OCURLY constructors CCURLY | ||||||
|  |         { $$ = definition_ptr(new definition_data(std::move($2), std::move($5))); } | ||||||
|  |     ; | ||||||
|  | 
 | ||||||
|  | constructors | ||||||
|  |     : constructors COMMA constructor { $$ = std::move($1); $$.push_back(std::move($3)); } | ||||||
|  |     | constructor | ||||||
|  |         { $$ = std::vector<constructor_ptr>(); $$.push_back(std::move($1)); } | ||||||
|  |     ; | ||||||
|  | 
 | ||||||
|  | constructor | ||||||
|  |     : UID uppercaseParams | ||||||
|  |         { $$ = constructor_ptr(new constructor(std::move($1), std::move($2))); } | ||||||
|  |     ; | ||||||
|  | 
 | ||||||
							
								
								
									
										159
									
								
								code/compiler/08/runtime.c
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										159
									
								
								code/compiler/08/runtime.c
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,159 @@ | |||||||
|  | #include <stdint.h> | ||||||
|  | #include <assert.h> | ||||||
|  | #include <memory.h> | ||||||
|  | #include "runtime.h" | ||||||
|  | 
 | ||||||
|  | struct node_base* alloc_node() { | ||||||
|  |     struct node_base* new_node = malloc(sizeof(struct node_app)); | ||||||
|  |     assert(new_node != NULL); | ||||||
|  |     return new_node; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | struct node_app* alloc_app(struct node_base* l, struct node_base* r) { | ||||||
|  |     struct node_app* node = (struct node_app*) alloc_node(); | ||||||
|  |     node->base.tag = NODE_APP; | ||||||
|  |     node->left = l; | ||||||
|  |     node->right = r; | ||||||
|  |     return node; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | struct node_num* alloc_num(int32_t n) { | ||||||
|  |     struct node_num* node = (struct node_num*) alloc_node(); | ||||||
|  |     node->base.tag = NODE_NUM; | ||||||
|  |     node->value = n; | ||||||
|  |     return node; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | struct node_global* alloc_global(void (*f)(struct stack*), int32_t a) { | ||||||
|  |     struct node_global* node = (struct node_global*) alloc_node(); | ||||||
|  |     node->base.tag = NODE_GLOBAL; | ||||||
|  |     node->arity = a; | ||||||
|  |     node->function = f; | ||||||
|  |     return node; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | struct node_ind* alloc_ind(struct node_base* n) { | ||||||
|  |     struct node_ind* node = (struct node_ind*) alloc_node(); | ||||||
|  |     node->base.tag = NODE_IND; | ||||||
|  |     node->next = n; | ||||||
|  |     return node; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void stack_init(struct stack* s) { | ||||||
|  |     s->size = 4; | ||||||
|  |     s->count = 0; | ||||||
|  |     s->data = malloc(sizeof(*s->data) * s->size); | ||||||
|  |     assert(s->data != NULL); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void stack_free(struct stack* s) { | ||||||
|  |     free(s->data); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void stack_push(struct stack* s, struct node_base* n) { | ||||||
|  |     while(s->count >= s->size) { | ||||||
|  |         s->data = realloc(s->data, sizeof(*s->data) * (s->size *= 2)); | ||||||
|  |         assert(s->data != NULL); | ||||||
|  |     } | ||||||
|  |     s->data[s->count++] = n; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | struct node_base* stack_pop(struct stack* s) { | ||||||
|  |     assert(s->count > 0); | ||||||
|  |     return s->data[--s->count]; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | struct node_base* stack_peek(struct stack* s, size_t o) { | ||||||
|  |     assert(s->count > o); | ||||||
|  |     return s->data[s->count - o - 1]; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void stack_popn(struct stack* s, size_t n) { | ||||||
|  |     assert(s->count >= n); | ||||||
|  |     s->count -= n; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void stack_slide(struct stack* s, size_t n) { | ||||||
|  |     assert(s->count > n); | ||||||
|  |     s->data[s->count - n - 1] = s->data[s->count - 1]; | ||||||
|  |     s->count -= n; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void stack_update(struct stack* s, size_t o) { | ||||||
|  |     assert(s->count > o + 1); | ||||||
|  |     struct node_ind* ind = (struct node_ind*) s->data[s->count - o - 2]; | ||||||
|  |     ind->base.tag = NODE_IND; | ||||||
|  |     ind->next = s->data[s->count -= 1]; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void stack_alloc(struct stack* s, size_t o) { | ||||||
|  |     while(o--) { | ||||||
|  |         stack_push(s, (struct node_base*) alloc_ind(NULL)); | ||||||
|  |     } | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void stack_pack(struct stack* s, size_t n, int8_t t) { | ||||||
|  |     assert(s->count >= n); | ||||||
|  | 
 | ||||||
|  |     struct node_base** data = malloc(sizeof(*data) * n); | ||||||
|  |     assert(data != NULL); | ||||||
|  |     memcpy(data, &s->data[s->count - 1 - n], n * sizeof(*data)); | ||||||
|  | 
 | ||||||
|  |     struct node_data* new_node = (struct node_data*) alloc_node(); | ||||||
|  |     new_node->array = data; | ||||||
|  |     new_node->base.tag = NODE_DATA; | ||||||
|  |     new_node->tag = t; | ||||||
|  | 
 | ||||||
|  |     stack_popn(s, n); | ||||||
|  |     stack_push(s, (struct node_base*) new_node); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void stack_split(struct stack* s, size_t n) { | ||||||
|  |     struct node_data* node = (struct node_data*) stack_pop(s); | ||||||
|  |     for(size_t i = 0; i < n; i++) { | ||||||
|  |         stack_push(s, node->array[i]); | ||||||
|  |     } | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void unwind(struct stack* s) { | ||||||
|  |     while(1) { | ||||||
|  |         struct node_base* peek = stack_peek(s, 0); | ||||||
|  |         if(peek->tag == NODE_APP) { | ||||||
|  |             struct node_app* n = (struct node_app*) peek; | ||||||
|  |             stack_push(s, n->left); | ||||||
|  |         } else if(peek->tag == NODE_GLOBAL) { | ||||||
|  |             struct node_global* n = (struct node_global*) peek; | ||||||
|  |             assert(s->count > n->arity); | ||||||
|  | 
 | ||||||
|  |             for(size_t i = 1; i <= n->arity; i++) { | ||||||
|  |                 s->data[s->count - i] | ||||||
|  |                     = ((struct node_app*) s->data[s->count - i - 1])->right; | ||||||
|  |             } | ||||||
|  | 
 | ||||||
|  |             n->function(s); | ||||||
|  |         } else if(peek->tag == NODE_IND) { | ||||||
|  |             struct node_ind* n = (struct node_ind*) peek; | ||||||
|  |             stack_pop(s); | ||||||
|  |             stack_push(s, n->next); | ||||||
|  |         } else { | ||||||
|  |             break; | ||||||
|  |         } | ||||||
|  |     } | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | struct node_base* eval(struct node_base* n) { | ||||||
|  |     struct stack program_stack; | ||||||
|  |     stack_init(&program_stack); | ||||||
|  |     stack_push(&program_stack, n); | ||||||
|  |     unwind(&program_stack); | ||||||
|  |     struct node_base* result = stack_pop(&program_stack); | ||||||
|  |     stack_free(&program_stack); | ||||||
|  |     return result; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | extern void f_main(struct stack* s); | ||||||
|  | 
 | ||||||
|  | int main(int argc, char** argv) { | ||||||
|  |     struct node_global* first_node = alloc_global(f_main, 0); | ||||||
|  |     struct node_base* result = eval((struct node_base*) first_node); | ||||||
|  | } | ||||||
							
								
								
									
										69
									
								
								code/compiler/08/runtime.h
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										69
									
								
								code/compiler/08/runtime.h
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,69 @@ | |||||||
|  | #pragma once | ||||||
|  | #include <stdlib.h> | ||||||
|  | 
 | ||||||
|  | struct stack; | ||||||
|  | 
 | ||||||
|  | enum node_tag { | ||||||
|  |     NODE_APP, | ||||||
|  |     NODE_NUM, | ||||||
|  |     NODE_GLOBAL, | ||||||
|  |     NODE_IND, | ||||||
|  |     NODE_DATA | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct node_base { | ||||||
|  |     enum node_tag tag; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct node_app { | ||||||
|  |     struct node_base base; | ||||||
|  |     struct node_base* left; | ||||||
|  |     struct node_base* right; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct node_num { | ||||||
|  |     struct node_base base; | ||||||
|  |     int32_t value; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct node_global { | ||||||
|  |     struct node_base base; | ||||||
|  |     int32_t arity; | ||||||
|  |     void (*function)(struct stack*); | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct node_ind { | ||||||
|  |     struct node_base base; | ||||||
|  |     struct node_base* next; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct node_data { | ||||||
|  |     struct node_base base; | ||||||
|  |     int8_t tag; | ||||||
|  |     struct node_base** array; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct node_base* alloc_node(); | ||||||
|  | struct node_app* alloc_app(struct node_base* l, struct node_base* r); | ||||||
|  | struct node_num* alloc_num(int32_t n); | ||||||
|  | struct node_global* alloc_global(void (*f)(struct stack*), int32_t a); | ||||||
|  | struct node_ind* alloc_ind(struct node_base* n); | ||||||
|  | 
 | ||||||
|  | struct stack { | ||||||
|  |     size_t size; | ||||||
|  |     size_t count; | ||||||
|  |     struct node_base** data; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | void stack_free(struct stack* s); | ||||||
|  | void stack_push(struct stack* s, struct node_base* n); | ||||||
|  | struct node_base* stack_pop(struct stack* s); | ||||||
|  | struct node_base* stack_peek(struct stack* s, size_t o); | ||||||
|  | void stack_popn(struct stack* s, size_t n); | ||||||
|  | void stack_slide(struct stack* s, size_t n); | ||||||
|  | void stack_update(struct stack* s, size_t o); | ||||||
|  | void stack_alloc(struct stack* s, size_t o); | ||||||
|  | void stack_pack(struct stack* s, size_t n, int8_t t); | ||||||
|  | void stack_split(struct stack* s, size_t n); | ||||||
|  | 
 | ||||||
|  | struct node_base* eval(struct node_base* n); | ||||||
							
								
								
									
										34
									
								
								code/compiler/08/scanner.l
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										34
									
								
								code/compiler/08/scanner.l
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,34 @@ | |||||||
|  | %option noyywrap | ||||||
|  | 
 | ||||||
|  | %{ | ||||||
|  | #include <iostream> | ||||||
|  | #include "ast.hpp" | ||||||
|  | #include "parser.hpp" | ||||||
|  | 
 | ||||||
|  | #define YY_DECL yy::parser::symbol_type yylex() | ||||||
|  | 
 | ||||||
|  | %} | ||||||
|  | 
 | ||||||
|  | %% | ||||||
|  | 
 | ||||||
|  | [ \n]+ {} | ||||||
|  | \+ { return yy::parser::make_PLUS(); } | ||||||
|  | \* { return yy::parser::make_TIMES(); } | ||||||
|  | - { return yy::parser::make_MINUS(); } | ||||||
|  | \/ { return yy::parser::make_DIVIDE(); } | ||||||
|  | [0-9]+ { return yy::parser::make_INT(atoi(yytext)); } | ||||||
|  | defn { return yy::parser::make_DEFN(); } | ||||||
|  | data { return yy::parser::make_DATA(); } | ||||||
|  | case { return yy::parser::make_CASE(); } | ||||||
|  | of { return yy::parser::make_OF(); } | ||||||
|  | \{ { return yy::parser::make_OCURLY(); } | ||||||
|  | \} { return yy::parser::make_CCURLY(); } | ||||||
|  | \( { return yy::parser::make_OPAREN(); } | ||||||
|  | \) { return yy::parser::make_CPAREN(); } | ||||||
|  | ,  { return yy::parser::make_COMMA(); } | ||||||
|  | -> { return yy::parser::make_ARROW(); } | ||||||
|  | = { return yy::parser::make_EQUAL(); } | ||||||
|  | [a-z][a-zA-Z]* { return yy::parser::make_LID(std::string(yytext)); } | ||||||
|  | [A-Z][a-zA-Z]* { return yy::parser::make_UID(std::string(yytext)); } | ||||||
|  | 
 | ||||||
|  | %% | ||||||
							
								
								
									
										99
									
								
								code/compiler/08/type.cpp
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										99
									
								
								code/compiler/08/type.cpp
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,99 @@ | |||||||
|  | #include "type.hpp" | ||||||
|  | #include <sstream> | ||||||
|  | #include <algorithm> | ||||||
|  | #include "error.hpp" | ||||||
|  | 
 | ||||||
|  | void type_var::print(const type_mgr& mgr, std::ostream& to) const { | ||||||
|  |     auto it = mgr.types.find(name); | ||||||
|  |     if(it != mgr.types.end()) { | ||||||
|  |         it->second->print(mgr, to); | ||||||
|  |     } else { | ||||||
|  |         to << name; | ||||||
|  |     } | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void type_base::print(const type_mgr& mgr, std::ostream& to) const { | ||||||
|  |     to << name; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void type_arr::print(const type_mgr& mgr, std::ostream& to) const { | ||||||
|  |     left->print(mgr, to); | ||||||
|  |     to << " -> ("; | ||||||
|  |     right->print(mgr, to); | ||||||
|  |     to << ")"; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | std::string type_mgr::new_type_name() { | ||||||
|  |     int temp = last_id++; | ||||||
|  |     std::string str = ""; | ||||||
|  | 
 | ||||||
|  |     while(temp != -1) { | ||||||
|  |         str += (char) ('a' + (temp % 26)); | ||||||
|  |         temp = temp / 26 - 1; | ||||||
|  |     } | ||||||
|  | 
 | ||||||
|  |     std::reverse(str.begin(), str.end()); | ||||||
|  |     return str; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | type_ptr type_mgr::new_type() { | ||||||
|  |     return type_ptr(new type_var(new_type_name())); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | type_ptr type_mgr::new_arrow_type() { | ||||||
|  |     return type_ptr(new type_arr(new_type(), new_type())); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | type_ptr type_mgr::resolve(type_ptr t, type_var*& var) const { | ||||||
|  |     type_var* cast; | ||||||
|  | 
 | ||||||
|  |     var = nullptr; | ||||||
|  |     while((cast = dynamic_cast<type_var*>(t.get()))) { | ||||||
|  |         auto it = types.find(cast->name); | ||||||
|  | 
 | ||||||
|  |         if(it == types.end()) { | ||||||
|  |             var = cast; | ||||||
|  |             break; | ||||||
|  |         } | ||||||
|  |         t = it->second; | ||||||
|  |     } | ||||||
|  | 
 | ||||||
|  |     return t; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void type_mgr::unify(type_ptr l, type_ptr r) { | ||||||
|  |     type_var* lvar; | ||||||
|  |     type_var* rvar; | ||||||
|  |     type_arr* larr; | ||||||
|  |     type_arr* rarr; | ||||||
|  |     type_base* lid; | ||||||
|  |     type_base* rid; | ||||||
|  | 
 | ||||||
|  |     l = resolve(l, lvar); | ||||||
|  |     r = resolve(r, rvar); | ||||||
|  | 
 | ||||||
|  |     if(lvar) { | ||||||
|  |         bind(lvar->name, r); | ||||||
|  |         return; | ||||||
|  |     } else if(rvar) { | ||||||
|  |         bind(rvar->name, l); | ||||||
|  |         return; | ||||||
|  |     } else if((larr = dynamic_cast<type_arr*>(l.get())) && | ||||||
|  |             (rarr = dynamic_cast<type_arr*>(r.get()))) { | ||||||
|  |         unify(larr->left, rarr->left); | ||||||
|  |         unify(larr->right, rarr->right); | ||||||
|  |         return; | ||||||
|  |     } else if((lid = dynamic_cast<type_base*>(l.get())) && | ||||||
|  |             (rid = dynamic_cast<type_base*>(r.get()))) { | ||||||
|  |         if(lid->name == rid->name) return; | ||||||
|  |     } | ||||||
|  | 
 | ||||||
|  |     throw unification_error(l, r); | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void type_mgr::bind(const std::string& s, type_ptr t) { | ||||||
|  |     type_var* other = dynamic_cast<type_var*>(t.get()); | ||||||
|  |      | ||||||
|  |     if(other && other->name == s) return; | ||||||
|  |     types[s] = t; | ||||||
|  | } | ||||||
							
								
								
									
										65
									
								
								code/compiler/08/type.hpp
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										65
									
								
								code/compiler/08/type.hpp
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,65 @@ | |||||||
|  | #pragma once | ||||||
|  | #include <memory> | ||||||
|  | #include <map> | ||||||
|  | 
 | ||||||
|  | struct type_mgr; | ||||||
|  | 
 | ||||||
|  | struct type { | ||||||
|  |     virtual ~type() = default; | ||||||
|  | 
 | ||||||
|  |     virtual void print(const type_mgr& mgr, std::ostream& to) const = 0; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | using type_ptr = std::shared_ptr<type>; | ||||||
|  | 
 | ||||||
|  | struct type_var : public type { | ||||||
|  |     std::string name; | ||||||
|  | 
 | ||||||
|  |     type_var(std::string n) | ||||||
|  |         : name(std::move(n)) {} | ||||||
|  | 
 | ||||||
|  |     void print(const type_mgr& mgr, std::ostream& to) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct type_base : public type { | ||||||
|  |     std::string name; | ||||||
|  | 
 | ||||||
|  |     type_base(std::string n)  | ||||||
|  |         : name(std::move(n)) {} | ||||||
|  | 
 | ||||||
|  |     void print(const type_mgr& mgr, std::ostream& to) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct type_data : public type_base { | ||||||
|  |     struct constructor { | ||||||
|  |         int tag; | ||||||
|  |     }; | ||||||
|  | 
 | ||||||
|  |     std::map<std::string, constructor> constructors; | ||||||
|  | 
 | ||||||
|  |     type_data(std::string n) | ||||||
|  |         : type_base(std::move(n)) {} | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct type_arr : public type { | ||||||
|  |     type_ptr left; | ||||||
|  |     type_ptr right; | ||||||
|  | 
 | ||||||
|  |     type_arr(type_ptr l, type_ptr r) | ||||||
|  |         : left(std::move(l)), right(std::move(r)) {} | ||||||
|  | 
 | ||||||
|  |     void print(const type_mgr& mgr, std::ostream& to) const; | ||||||
|  | }; | ||||||
|  | 
 | ||||||
|  | struct type_mgr { | ||||||
|  |     int last_id = 0; | ||||||
|  |     std::map<std::string, type_ptr> types; | ||||||
|  | 
 | ||||||
|  |     std::string new_type_name(); | ||||||
|  |     type_ptr new_type(); | ||||||
|  |     type_ptr new_arrow_type(); | ||||||
|  | 
 | ||||||
|  |     void unify(type_ptr l, type_ptr r); | ||||||
|  |     type_ptr resolve(type_ptr t, type_var*& var) const; | ||||||
|  |     void bind(const std::string& s, type_ptr t); | ||||||
|  | }; | ||||||
							
								
								
									
										16
									
								
								code/compiler/08/type_env.cpp
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										16
									
								
								code/compiler/08/type_env.cpp
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,16 @@ | |||||||
|  | #include "type_env.hpp" | ||||||
|  | 
 | ||||||
|  | type_ptr type_env::lookup(const std::string& name) const { | ||||||
|  |     auto it = names.find(name); | ||||||
|  |     if(it != names.end()) return it->second; | ||||||
|  |     if(parent) return parent->lookup(name); | ||||||
|  |     return nullptr; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | void type_env::bind(const std::string& name, type_ptr t) { | ||||||
|  |     names[name] = t; | ||||||
|  | } | ||||||
|  | 
 | ||||||
|  | type_env type_env::scope() const { | ||||||
|  |     return type_env(this); | ||||||
|  | } | ||||||
							
								
								
									
										16
									
								
								code/compiler/08/type_env.hpp
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										16
									
								
								code/compiler/08/type_env.hpp
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,16 @@ | |||||||
|  | #pragma once | ||||||
|  | #include <map> | ||||||
|  | #include "type.hpp" | ||||||
|  | 
 | ||||||
|  | struct type_env { | ||||||
|  |     std::map<std::string, type_ptr> names; | ||||||
|  |     type_env const* parent = nullptr; | ||||||
|  | 
 | ||||||
|  |     type_env(type_env const* p) | ||||||
|  |         : parent(p) {} | ||||||
|  |     type_env() : type_env(nullptr) {} | ||||||
|  | 
 | ||||||
|  |     type_ptr lookup(const std::string& name) const; | ||||||
|  |     void bind(const std::string& name, type_ptr t); | ||||||
|  |     type_env scope() const; | ||||||
|  | }; | ||||||
							
								
								
									
										53
									
								
								content/blog/08_compiler_llvm.md
									
									
									
									
									
										Normal file
									
								
							
							
						
						
									
										53
									
								
								content/blog/08_compiler_llvm.md
									
									
									
									
									
										Normal file
									
								
							| @ -0,0 +1,53 @@ | |||||||
|  | --- | ||||||
|  | title: Compiling a Functional Language Using C++, Part 8 - LLVM | ||||||
|  | date: 2019-10-30T22:16:22-07:00 | ||||||
|  | draft: true | ||||||
|  | tags: ["C and C++", "Functional Languages", "Compilers"] | ||||||
|  | --- | ||||||
|  | 
 | ||||||
|  | We don't want a compiler that can only generate code for a single | ||||||
|  | platform. Our language should work on macOS, Windows, and Linux, | ||||||
|  | on x86\_64, ARM, and maybe some other architectures. We also | ||||||
|  | don't want to manually implement the compiler for each platform, | ||||||
|  | dealing with the specifics of each architecture and operating | ||||||
|  | system. | ||||||
|  | 
 | ||||||
|  | This is where LLVM comes in. LLVM (which stands for __Low Level Virtual Machine__), | ||||||
|  | is a project which presents us with a kind of generic assembly language, | ||||||
|  | an __Intermediate Representation__ (IR). It also provides tooling to compile the | ||||||
|  | IR into platform-specific instructions, as well as to apply a host of various | ||||||
|  | optimizations. We can thus translate our G-machine instructions to LLVM, | ||||||
|  | and then use LLVM to generate machine code, which gets us to our ultimate | ||||||
|  | goal of compiling our language. | ||||||
|  | 
 | ||||||
|  | We start with adding LLVM to our CMake project. | ||||||
|  | {{< codelines "CMake" "compiler/08/CMakeLists.txt" 7 7 >}} | ||||||
|  | 
 | ||||||
|  | LLVM is a huge project, and has many components. We don't need | ||||||
|  | most of them. We do need the core libraries, the x86 assembly | ||||||
|  | generator, and x86 assembly parser. I'm | ||||||
|  | not sure why we need the last one, but I ran into linking | ||||||
|  | errors without them. We find the required link targets | ||||||
|  | for these components using this CMake command: | ||||||
|  | 
 | ||||||
|  | {{< codelines "CMake" "compiler/08/CMakeLists.txt" 19 20 >}} | ||||||
|  | 
 | ||||||
|  | Finally, we add the new include directories, link targets, | ||||||
|  | and definitions to our compiler executable: | ||||||
|  | 
 | ||||||
|  | {{< codelines "CMake" "compiler/08/CMakeLists.txt" 39 41 >}} | ||||||
|  | 
 | ||||||
|  | Great, we have the infrastructure updated to work with LLVM. It's | ||||||
|  | now time to start using the LLVM API to compile our G-machine instructions | ||||||
|  | into assembly. We start with `LLVMContext`. The LLVM documentation states: | ||||||
|  | 
 | ||||||
|  | > This is an important class for using LLVM in a threaded context. | ||||||
|  | > It (opaquely) owns and manages the core "global" data of LLVM's core infrastructure, including the type and constant uniquing tables.  | ||||||
|  | 
 | ||||||
|  | We will have exactly one instance of such a class in our program. | ||||||
|  | 
 | ||||||
|  | Additionally, we want an `IRBuilder`, which will help us generate IR instructions, | ||||||
|  | placing them into basic blocks (more on that in a bit). Also, we want | ||||||
|  | a `Module` object, which represents some collection of code and declarations | ||||||
|  | (perhaps like a C++ source file). Let's keep these things in our own | ||||||
|  | `llvm_state` class. | ||||||
| @ -1,6 +1,8 @@ | |||||||
| $container-width: 800px; | $container-width: 800px; | ||||||
| $primary-color: #36e281; | $primary-color: #36e281; | ||||||
| $primary-color-dark: darken($primary-color, 10%); | $primary-color-dark: darken($primary-color, 10%); | ||||||
|  | $code-color: #f0f0f0; | ||||||
|  | $code-color-dark: darken($code-color, 10%); | ||||||
| $font-heading: "Lora", serif; | $font-heading: "Lora", serif; | ||||||
| $font-body: "Raleway", serif; | $font-body: "Raleway", serif; | ||||||
| $font-code: "Inconsolata", monospace; | $font-code: "Inconsolata", monospace; | ||||||
| @ -10,6 +12,7 @@ body { | |||||||
|   font-size: 1.0em; |   font-size: 1.0em; | ||||||
|   line-height: 1.5; |   line-height: 1.5; | ||||||
|   margin-bottom: 1em; |   margin-bottom: 1em; | ||||||
|  |   text-align: justify; | ||||||
| } | } | ||||||
| 
 | 
 | ||||||
| h1, h2, h3, h4, h5, h6 { | h1, h2, h3, h4, h5, h6 { | ||||||
| @ -29,14 +32,14 @@ h1, h2, h3, h4, h5, h6 { | |||||||
| 
 | 
 | ||||||
| code { | code { | ||||||
|   font-family: $font-code; |   font-family: $font-code; | ||||||
|   background-color: #f0f0f0; |   background-color: $code-color; | ||||||
| } | } | ||||||
| 
 | 
 | ||||||
| pre code { | pre code { | ||||||
|     display: block; |     display: block; | ||||||
|     padding: 0.5em; |     padding: 0.5em; | ||||||
|     overflow-x: auto; |     overflow-x: auto; | ||||||
|     background-color: #f0f0f0; |     background-color: $code-color; | ||||||
| } | } | ||||||
| 
 | 
 | ||||||
| .container { | .container { | ||||||
| @ -126,18 +129,6 @@ a { | |||||||
|   text-decoration: none; |   text-decoration: none; | ||||||
| } | } | ||||||
| 
 | 
 | ||||||
| input[type="text"], input[type="password"], textarea { |  | ||||||
|   padding: 0.5em 0em 0.5em 0em; |  | ||||||
|   margin: 0.5em 0.5em 0.5em 0em; |  | ||||||
|   border: none; |  | ||||||
|   border-bottom: solid 0.2em $primary-color-dark; |  | ||||||
|   transition: border 0.25s; |  | ||||||
|   &:focus { |  | ||||||
|     outline: none; |  | ||||||
|     border-bottom: solid 0.2em white; |  | ||||||
|   } |  | ||||||
| } |  | ||||||
| 
 |  | ||||||
| img { | img { | ||||||
|   max-width: 100% |   max-width: 100% | ||||||
| } | } | ||||||
|  | |||||||
		Loading…
	
		Reference in New Issue
	
	Block a user