]> git.ipfire.org Git - thirdparty/FORT-validator.git/log
thirdparty/FORT-validator.git
3 years agoDocumentation: update FreeBSD build instructions 63/head
Philip Paeps [Wed, 27 Oct 2021 07:41:28 +0000 (15:41 +0800)] 
Documentation: update FreeBSD build instructions

While binary packages are available, some people like to build from
source.  Update the instructions for building from a port, a release
tarball or a Git checkout.

3 years agoDocumentation: note FreeBSD packages exist
Philip Paeps [Wed, 27 Oct 2021 07:41:28 +0000 (15:41 +0800)] 
Documentation: note FreeBSD packages exist

A port of FORT validator was committed to the FreeBSD ports tree and
binary packages are now available.  Add instructions for using FreeBSD
packages.

3 years agoDocumentation: Update links to the latest binaries
Alberto Leiva Popper [Thu, 21 Oct 2021 02:32:29 +0000 (21:32 -0500)] 
Documentation: Update links to the latest binaries

3 years agoProtocolary updates for release 1.5.2 1.5.2
Alberto Leiva Popper [Tue, 19 Oct 2021 19:47:01 +0000 (14:47 -0500)] 
Protocolary updates for release 1.5.2

3 years agoReorganize imports in common and address modules
Alberto Leiva Popper [Tue, 19 Oct 2021 17:01:12 +0000 (12:01 -0500)] 
Reorganize imports in common and address modules

Was throwing a compilation warning in FreeBSD.

3 years agoCherry-pick 5afab1693bd5983fd3d6cf5aac63770807d74d90
Alberto Leiva Popper [Tue, 19 Oct 2021 03:02:58 +0000 (22:02 -0500)] 
Cherry-pick 5afab1693bd5983fd3d6cf5aac63770807d74d90

Best include this in the upcoming release.

3 years agoCertificate: Remove a bunch of unreachable code
Alberto Leiva Popper [Mon, 18 Oct 2021 21:34:33 +0000 (16:34 -0500)] 
Certificate: Remove a bunch of unreachable code

Also patches a bad cleanup that happened when certificate extension
errors were found.

Fixes #61.

3 years agoTemporary #58 solution
Alberto Leiva Popper [Wed, 13 Oct 2021 05:18:07 +0000 (00:18 -0500)] 
Temporary #58 solution

Completely axes the whole ordeal.

Is not a long-term solution, but will lead to stable behavior until
the other branch has been thoroughly tested.

3 years agoCertificate stack: Remove bogus x509stack_cancel()
Alberto Leiva Popper [Mon, 11 Oct 2021 21:22:08 +0000 (16:22 -0500)] 
Certificate stack: Remove bogus x509stack_cancel()

It seems the #58 and #59 problem is a stray defer separator pop.

The comment above x509stack_cancel() clearly states that the function
should only be called shortly after a x509stack_push(), but there's one
in certificate_traverse() that isn't.

Removing this x509stack_cancel() seems to prevent the crash. I'm still
investigating the original intent of this code.

Tentatively f1xes #58 and #59.

3 years agoRRDP: Patch deltas foreach
Alberto Leiva Popper [Wed, 29 Sep 2021 00:01:00 +0000 (19:01 -0500)] 
RRDP: Patch deltas foreach

The foreach was looping past the array limits.

Likely fixes #57.

3 years agoCertificates: Fuse meta and level stacks
Alberto Leiva Popper [Wed, 8 Sep 2021 17:40:26 +0000 (12:40 -0500)] 
Certificates: Fuse meta and level stacks

These stacks always had the same size, and their corresponding elements
always referred to the same certificate.

This was pending work from #55, which I think is now properly solved.

Also refactors x509stack_push(); was messy. Patched an unlikely memory
leak in the chaos.

3 years agoStartup: Print version number better
Alberto Leiva Popper [Mon, 6 Sep 2021 16:05:00 +0000 (11:05 -0500)] 
Startup: Print version number better

Version number is now inferred by git during the autogen.sh step.

It's a more automated version of the previous commit.

3 years agoStartup: Print version number
Alberto Leiva Popper [Sat, 4 Sep 2021 05:33:54 +0000 (00:33 -0500)] 
Startup: Print version number

Just to make sure ongoing debugs are running the right version.

Needs to be more automated.

3 years agoRRDP Notification: Optimize delta parse
Alberto Leiva Popper [Sat, 4 Sep 2021 04:58:01 +0000 (23:58 -0500)] 
RRDP Notification: Optimize delta parse

It was allocating the deltas array twice, for seemingly no reason.
Also, the array slots were pointers, and the two arrays pointed to
different instances of the same objects. For seemingly no reason.

Now there's only one array, and it stores the objects directly.

Also adds relevant unit tests.

3 years agoCertificate stack: Revert levels stack when x509stack_push() fails
Alberto Leiva Popper [Tue, 31 Aug 2021 23:28:15 +0000 (18:28 -0500)] 
Certificate stack: Revert levels stack when x509stack_push() fails

Likely fixes #55.

3 years agoMake FORT compile on OpenBSD 54/head
Job Snijders [Mon, 30 Aug 2021 17:07:15 +0000 (17:07 +0000)] 
Make FORT compile on OpenBSD

3 years agoRTR Server: Prevent crash when server.address is NULL
Alberto Leiva Popper [Mon, 9 Aug 2021 15:03:09 +0000 (10:03 -0500)] 
RTR Server: Prevent crash when server.address is NULL

Fixes #51.

3 years agoProtocolary updates for release 1.5.1 v1.5.1
Alberto Leiva Popper [Fri, 6 Aug 2021 20:55:00 +0000 (15:55 -0500)] 
Protocolary updates for release 1.5.1

3 years agoConfig: Improve --init-tals
Alberto Leiva Popper [Thu, 29 Jul 2021 22:56:15 +0000 (17:56 -0500)] 
Config: Improve --init-tals

1. Update the TAL URLs. (The old ones were very obsolete.)
2. Add --init-as0-tals. (Used to download the ASN0 TALs.)
3. Deprecate and zero-op --init-locations. (Didn't make sense.
   If the user needs a different URL, they can do wget instead.)
4. Deprecate setup_fort.sh. (Seems to be redundant. --init-tals
   already takes care of downloading TALs.)

3 years agoRTR Server: Clean up clients array after every poll
Alberto Leiva Popper [Thu, 29 Jul 2021 20:55:20 +0000 (15:55 -0500)] 
RTR Server: Clean up clients array after every poll

This was a pending optimization from commit
23478fdff80e8ceeaeeaffc71880f950b3c71104.

In truth, this data structure should technically be a linked list.
But I'm not sure if sacrificing cache locality for faster removal is
worth the tradeoff.

3 years agoTODOs: Reprioritize
Alberto Leiva Popper [Thu, 29 Jul 2021 20:53:43 +0000 (15:53 -0500)] 
TODOs: Reprioritize

There were a lot of FIXMEs that were minor nice-to-haves at best.

3 years agoRTR Server: poll before writing
Alberto Leiva Popper [Wed, 14 Jul 2021 15:25:43 +0000 (10:25 -0500)] 
RTR Server: poll before writing

Problem:

write() was sometimes failing with EAGAIN when Fort tried to send PDUs
to clients.

Diagnosis:

Obviously, it's because RTR client sockets now ship with O_NONBLOCK
enabled. Fort wants O_NONBLOCK for reading, but not for writing.

This bug was introduced in the previous commit.

Solution:

Make sure the socket is writable (via poll()) before calling write().

4 years agoRTR Server: thread-pool.server.max now refers to RTR requests
Alberto Leiva Popper [Wed, 7 Jul 2021 19:42:39 +0000 (14:42 -0500)] 
RTR Server: thread-pool.server.max now refers to RTR requests

Apparently, there was a huge misunderstanding when the thread pool was
implemented.

The intended model was

> When the RTR server receives a request, it borrows a thread from the
> thread pool, and tasks it with the request.

Which is logical and a typical thread pool use case. However, what was
actually implemented was

> When the RTR server opens a connection, it borrows a thread from the
> thread pool, and tasks it with the whole connection.

So `thread-pool.server.max` was a hard limit for simultaneous RTR
clients (routers), but now it's just a limit to simultaneous RTR
requests. (Surplus requests will queue.) This is much less taxing to the
CPU when there are hundreds of clients.

Thanks to Mark Tinka for basically spelling this out to me.

-----------------------

Actually, this commit is an almost entire rewrite of the RTR server
core. Here's a (possibly incomplete) list of other problems I had to fix
in the process:

== Problem 1 ==

sockaddr2str() was returning a pointer to invalid memory on success.

This was due to a naive attempt of a bugfix from
1ff403a0c7f61d443cbc4e2e512b8d0324547856.

== Problem 2 ==

Changed the delta expiration conditional.

Was "keep track of the clients, expire deltas when all clients outgrow
them." I see two problems with that:

1. It'll lead to bad performance if a client misbehaves by not
   maintaining the connection. (ie. the server will have to fall back to
   too many cache resets.)
2. It might keep the deltas forever if a client bugs out without killing
   the connection.

New conditional is "keep deltas for server.deltas.lifetime iterations."
"server.deltas.lifetime" is a new configuration argument.

== Problem 3 ==

Serials weren't being compared according to RFC 1982 serial arithmetic.
This was going to cause mayhem when the integer wrapped.

(Though Fort always starts at 1, and serials are 32-bit unsigned
integers, so this wasn't going to be a problem for a very long time.)

== Problem 4 ==

The thread pool had an awkward termination bug. When threads were
suspended, they were meant to be ended through a pthread signal, but
when they were running, they were supposed to be terminated through
pthread_cancel(). (Because, since each client was assigned a thread,
they would spend most of their time sleeping.) These termination methods
don't play well with each other.

Apparently, threads waiting on a signal cannot be canceled, because of
this strange quirk from man 3 pthread_cond_wait:

> a side effect of acting upon a cancellation request while in a
> condition wait is that the mutex is (in effect) re-acquired before
> calling the first cancellation cleanup handler.

(So the first thread dies with the mutex locked, and no other threads
can be canceled because no one can ever lock the mutex again.)

And of course, you can't stop a server thread through a signal, because
they aren't listening to it; they're sleeping in wait for a request.

I still don't really know how would I fix this, but luckily, the problem
no longer exists since working threads are mapped to single requests,
and therefore no longer sleep. (For long periods of time, anyway.)
So always using the signal works fine.

4 years agoRTR Server: Clear O_NONBLOCK on client sockets
Alberto Leiva Popper [Mon, 5 Jul 2021 15:15:45 +0000 (10:15 -0500)] 
RTR Server: Clear O_NONBLOCK on client sockets

It seems that client sockets inherit the O_NONBLOCK flag from the server
socket on some implementations of `accept()`.

We definitely don't want O_NONBLOCK on client sockets, so clear it
explicitely every time.

4 years agoVRPS: Clean up validation core
Alberto Leiva Popper [Fri, 2 Jul 2021 23:58:19 +0000 (18:58 -0500)] 
VRPS: Clean up validation core

It was pretty messy; I had to rewrite a good chunk of it.

== Problem 1 ==

It was discarding meaningful validation results when miscellaneous
errors prevented the deltas array from being built.

Deltas are optional; as long as Fort has the snapshot of the latest
tree, it doesn't technically need deltas. They speed up synchronization,
but in the worst case scenario, the RTR server can keep pushing Cache
Resets.

Severity: Warning. Memory allocation failures are the only eventuality
that might prevent the deltas array from being built.

== Problem 2 ==

The database was always keeping one serial's worth of obsolete deltas.

Cleaned up, saves a potentially large amount of memory.

Severity: Fine. Not a memory leak.

== Problem 3 ==

The code computed deltas even whene there were no routers listening.
Routers are the only delta consumers, so there was no need to waste all
that time.

Severity: Fine; performance quirk.

== Problem 4 ==

I found an RTR client implementation (Cloudflare's rpki-rtr-client) that
hangs when the first serial is zero. Fort's first serial is now 1.

Severity: Warning. This is rpki-rtr-client's fault, but any client
implementations are prone to the same bug. The new solution is more
future-proof.

== Problem 5 ==

It seems it wasn't cleaning the deltas array when all routers were known
to have bogus serials. This was the code:

/* Its the first element or reached end, nothing to purge */
if (group == state.deltas.array ||
   (group - state.deltas.array) == state.deltas.len)
return 0;

If you reached the end of the deltas array, and the minimum router
serial is larger than all the array serials, then all deltas are
useless; you're supposed to purge all of them.

Severity: Fine. It was pretty hard to trigger, and not a memory leak.

4 years agoinit: Remove SIGPIPE SIG_IGN override during RTR server startup
Alberto Leiva Popper [Fri, 2 Jul 2021 23:56:34 +0000 (18:56 -0500)] 
init: Remove SIGPIPE SIG_IGN override during RTR server startup

Because it's now redundant.

As discovered in #49, SIGPIPE is total bullshit in all circumstances, no
exceptions, so there's now a global SIGPIPE SIG_IGN override, rendering
this one useless.

I guess we now know why #49 never triggered on server mode.

4 years agoMain: Add a result code sanitizer
Alberto Leiva Popper [Thu, 24 Jun 2021 19:09:31 +0000 (14:09 -0500)] 
Main: Add a result code sanitizer

Improves the exit status code.

4 years agoGlobal: Further #49 cleanup
Alberto Leiva Popper [Thu, 24 Jun 2021 17:44:55 +0000 (12:44 -0500)] 
Global: Further #49 cleanup

4 years agoTAL: Remove leftover #49 debug messages
Alberto Leiva Popper [Thu, 24 Jun 2021 14:46:04 +0000 (09:46 -0500)] 
TAL: Remove leftover #49 debug messages

4 years agoGlobal: Ignore SIGPIPE
Alberto Leiva Popper [Mon, 21 Jun 2021 21:14:50 +0000 (16:14 -0500)] 
Global: Ignore SIGPIPE

I think I finally found #49. The signal is not SIGSYS; it's SIGPIPE.
That's why dorpauli was getting no core dumps.

Apparently, this is a typical newbie trap for libcurl users.
CURLOPT_NOSIGNAL is incapable of supressing all SIGPIPEs, because some
of them are OS-generated.

I can't believe how dumb SIGPIPE has turned out to be. I/O functions
should return EPIPE; not interrupt the whole program to a handler that
defaults to "die silently."

What the hell, POSIX.

4 years agohttp: Force curl_easy_setopt() to use longs more
Alberto Leiva Popper [Tue, 15 Jun 2021 18:28:58 +0000 (13:28 -0500)] 
http: Force curl_easy_setopt() to use longs more

This is not likely to be useful.

4 years agohttp: Eliminate the custom writefunction
Alberto Leiva Popper [Tue, 15 Jun 2021 17:40:39 +0000 (12:40 -0500)] 
http: Eliminate the custom writefunction

The writefunction was incorrect. It's supposed to return an unsigned
value, but yielded -EINVAL on error.

The default writefunction is `fwrite(3)`, which is perfect for Fort's
purposes.

4 years agoLog: Add handlers for all common signals
Alberto Leiva Popper [Sat, 12 Jun 2021 00:10:09 +0000 (19:10 -0500)] 
Log: Add handlers for all common signals

These should be safe. They just print the signal number, the stack
trace, then restore the original behavior.

The only problem is I can't do the same with SIGKILL nor SIGSTOP,
but I suppose if SIGKILL were the problem, the kernel would have left
something in the logs. And SIGSTOP would have left the process alive.

Intended for #49.

4 years agoLog: Remove illegal operations from segfault handler
Alberto Leiva Popper [Fri, 11 Jun 2021 23:07:31 +0000 (18:07 -0500)] 
Log: Remove illegal operations from segfault handler

Signal handlers are not technically allowed to call backtrace_symbols(),
fprintf(), syslog() nor free().

4 years agoLog: Revert ad841d5024bea7f7d9243a0aae5fdecc40afcd3b
Alberto Leiva Popper [Fri, 11 Jun 2021 19:59:29 +0000 (14:59 -0500)] 
Log: Revert ad841d5024bea7f7d9243a0aae5fdecc40afcd3b

ad841d50 was a mistake. It was never agreed in #40 that Fort should
shotgun blast its own face on the first ENOMEM, and even if it was, the
idea is preposterous. Memory allocation failures are neither programming
errors nor an excuse to leave all the routers hanging.

While there's some truth to the notion that a Fort memory leak (which
has been exhausting memory over time) could be temporarily amended by
killing Fort (and letting the OS clean it up), the argument completely
misses the reality that memory allocation failures could happen
regardless of the existence of a memory leak.

A memory leak is a valid reason to throw away the results of a current
validation run (as long as the admin is warned), but an existing
validation result and the RTR server must remain afloat.

Also includes a pr_enomem() caller review.

4 years agoThread pool: Convert threads to joinable
Alberto Leiva Popper [Mon, 7 Jun 2021 19:22:17 +0000 (14:22 -0500)] 
Thread pool: Convert threads to joinable

Hypothesis: Something (which I haven't spotted yet) was causing the
main thread to skip its wait before the pool threads finished their
tasks. Maybe something to do with the ready signal again?

So the main thread returned early, which means pool threads were
silently suppressed by the OS. That explains the early terminations and
nonexistent stack traces.

If I keep finding crippling errors like this, I will definitely have to
purge the thread pool. It's turned out to be a fucking bug colony at
this point. I'm sick of it.

Way I see it, the root of the problem was the thread pool's control
code, which was too complicated for its own good. A surprisingly large
part of why it was overcomplicated was because it reinvented thread
joining.

So I simplified the control code by removing the detach property. Now
that the main thread joins the proper way, the validation code will not
be interrupted anymore.

This might well be the solution for #49. However, it bothers me that I
still don't have a reasonable explanation as to why the main thread
seemed to be skipping wait.

Argh!

4 years agoScatter more specific debugging messages near the bug
Alberto Leiva Popper [Fri, 4 Jun 2021 05:37:21 +0000 (00:37 -0500)] 
Scatter more specific debugging messages near the bug

Iterates from the previous commit.

4 years agoScatter lots of debugging messages near the bug
Alberto Leiva Popper [Fri, 28 May 2021 00:51:23 +0000 (19:51 -0500)] 
Scatter lots of debugging messages near the bug

Wasted too much time looking for the stack trace, and still got
nothing. It's time for some old-fashioned college style debugging.

4 years agoCode review
Alberto Leiva Popper [Thu, 27 May 2021 22:04:36 +0000 (17:04 -0500)] 
Code review

1. (error) Fix the --work-offline flag.
   It has been unused since commit
   85478ff30ebc029abb0ded48de5b557f52a758e0.
2. (performance) Remove redundant fopen() and fclose() during
   valid_file_or_dir().
   If stat() is used instead of fstat(), there's no need to open and
   close the file.
   (Technically, it's no longer validating readabilty, but since the
   validator downloads the files, read permission errors should be
   extremely rare, and can be catched later.)
3. (fine) Remove return value from thread_pool_task_cb.
   This wasn't a problem, but the return value was meaningless, and
   no callers were using it.

4 years agoCode review
Alberto Leiva Popper [Wed, 26 May 2021 01:17:09 +0000 (20:17 -0500)] 
Code review

- Main validation loop: Remove some confusing, seemingly needless
  wrapper functions.
- Libcurl: Catch lots of status codes properly
- Libcurl: Send proper data types to curl_easy_setopt()
  (Argument types were not matching documented requirements.)
- RTR server: Reduce argument lists.

4 years agoUnit tests: Update
Alberto Leiva Popper [Mon, 24 May 2021 18:30:01 +0000 (13:30 -0500)] 
Unit tests: Update

4 years agoPatch previous commit
Alberto Leiva Popper [Mon, 24 May 2021 17:49:22 +0000 (12:49 -0500)] 
Patch previous commit

That merge didn't go smoothly.

4 years agoMerge branch 'issue49'
Alberto Leiva Popper [Mon, 24 May 2021 17:41:21 +0000 (12:41 -0500)] 
Merge branch 'issue49'

4 years agoThread pool: Code review
Alberto Leiva Popper [Wed, 28 Apr 2021 01:47:03 +0000 (20:47 -0500)] 
Thread pool: Code review

Gets rid of some inconsistencies, but no bugs as far as I can tell.

4 years agoLogging: More refactors
Alberto Leiva Popper [Fri, 21 May 2021 18:30:32 +0000 (13:30 -0500)] 
Logging: More refactors

1. Merges the log and debug modules. I think their separation was the
   reason why they forgot to add stack traces to syslog when they added
   syslog to the project.
   Not risking that mistake again.
2. Removes as many obstacles as possible from stack trace printing on
   critical errors.
3. Add mutexes to logging. This should prevent messages from mixing on
   top of each other when there are threads.

4 years agoLogging: Code review
Alberto Leiva Popper [Thu, 20 May 2021 18:26:21 +0000 (13:26 -0500)] 
Logging: Code review

Two bugfixes:

1. (warning) The libcrypto error stack trace was always showing empty.
   This was because of a bad counter.
2. (critical) Normal stack traces were only being printed in the
   standard streams, never on syslog.
   This is probably the reason why we don't have a proper error message
   on #49. It's probably a segmentation fault.

Also a whole bunch of cleanup. The logging module had a bit of a
duplicate code problem.

4 years agoDocumentation: Show multiple server address config in JSON example
Alberto Leiva Popper [Fri, 14 May 2021 23:58:52 +0000 (18:58 -0500)] 
Documentation: Show multiple server address config in JSON example

Feedback came from private mails.

4 years agoThread pool: Print more debug information
Alberto Leiva Popper [Thu, 22 Apr 2021 20:32:56 +0000 (15:32 -0500)] 
Thread pool: Print more debug information

Might help us catch #49.

4 years agoThread pool: Patch previous commit
Alberto Leiva Popper [Wed, 7 Apr 2021 21:41:43 +0000 (16:41 -0500)] 
Thread pool: Patch previous commit

I accidentally removed a lock operation in the previous commit,
so lots of undefined behavior was being triggered.

Also, restores (but improves) the thread ready signal. It's hard to
explain:

- Before: Workers send ready signal to parent,
  but parent might not be listening yet;
  Therefore parent timeouts on wait.
- Previous: Workers do not send ready signal to parent.
  Therefore, parent might signal work when no workers are ready yet;
  Therefore nobody works.
- Now: Workers send ready signal to parent,
  parent listens lazily (ie. late), but only if workers aren't ready
  yet.
  Therefore, correct behavior.

4 years agoThread pool: remove thread ready signal
Alberto Leiva Popper [Wed, 7 Apr 2021 20:11:44 +0000 (15:11 -0500)] 
Thread pool: remove thread ready signal

It seems the workers were sending the "ready" signal before the
parent thread started to wait for it. This lead to timeouts.

The parent thread doesn't really need to wait for the worker
threads to carry on with its own work, so I've decided to remove
the check.

Progress on #49.

4 years agoDocumentation: Update status
Alberto Leiva Popper [Tue, 6 Apr 2021 17:54:20 +0000 (12:54 -0500)] 
Documentation: Update status

Also elaborates on some command line flag documentation that has
changed since the last release.

4 years agoDocumentation: Fix formatting of usage.html
Alberto Leiva Popper [Tue, 23 Feb 2021 23:31:39 +0000 (17:31 -0600)] 
Documentation: Fix formatting of usage.html

Some '<' and '>' symbols where disrupting Jekyll's parser.

4 years agoMerge branch 'reschke-master'
Alberto Leiva Popper [Tue, 23 Feb 2021 22:47:35 +0000 (16:47 -0600)] 
Merge branch 'reschke-master'

4 years agoImprove NID retrieval/registration
Alberto Leiva Popper [Tue, 23 Feb 2021 17:42:38 +0000 (11:42 -0600)] 
Improve NID retrieval/registration

Curiously, old code used to assume the RPKI objects would never
be added to Libre/OpenSSL. New code handles the objects already
existing.

Attempts to fix #48; untested still.

4 years agoMerge branch 'master' into master 47/head
Julian Reschke [Fri, 19 Feb 2021 09:36:57 +0000 (10:36 +0100)] 
Merge branch 'master' into master

4 years agoUpdate docs, set 'router-keys' as name for output.bgpsec in json format
pcarana [Thu, 18 Feb 2021 04:41:33 +0000 (22:41 -0600)] 
Update docs, set 'router-keys' as name for output.bgpsec in json format

4 years agoAdd argument to set the desired output format
pcarana [Thu, 18 Feb 2021 02:08:30 +0000 (20:08 -0600)] 
Add argument to set the desired output format

4 years agosupport ROA export in JSON formatwq
reschke [Wed, 10 Feb 2021 18:01:44 +0000 (19:01 +0100)] 
support ROA export in JSON formatwq

4 years agoFix rsync and thread pool bugs. 1.5.0 v1.5.0
pcarana [Wed, 27 Jan 2021 15:32:18 +0000 (09:32 -0600)] 
Fix rsync and thread pool bugs.

+Mistakenly (of course, it was a bug) the returned value from rsync execution was being confused with the returned value from execvp call. The main problem was when rsync returned a code 12 (Error in rsync protocol data stream); in that case, the caller confused that error with ENOMEM (also with value 12), which led to terminate execution.
+The thread pool wait function wasn't considering pending taks at the queue; also the poll function was holding and releasing the mutex more than it was needed, and the thread attributes are now globally initialized (thanks @ydahhrk for the code review).
+Increment the number of threads at the internal pool to 10.

4 years agoFix vCard broken unit test
pcarana [Mon, 18 Jan 2021 22:33:02 +0000 (16:33 -0600)] 
Fix vCard broken unit test

4 years agoFix vCard properties basic validation
pcarana [Wed, 13 Jan 2021 16:47:24 +0000 (10:47 -0600)] 
Fix vCard properties basic validation

4 years agoUpdate license year
pcarana [Thu, 7 Jan 2021 22:53:15 +0000 (16:53 -0600)] 
Update license year

4 years agoAdd 'Quick Start' paragraph and some usage examples of --init-tals
pcarana [Tue, 15 Dec 2020 23:00:51 +0000 (17:00 -0600)] 
Add 'Quick Start' paragraph and some usage examples of --init-tals

4 years agoUpdate default value of thread-pool.validation.max to 5
pcarana [Tue, 15 Dec 2020 00:37:17 +0000 (18:37 -0600)] 
Update default value of thread-pool.validation.max to 5

4 years agoUse --tal argument with --init-tals (that now is a flag)
pcarana [Tue, 15 Dec 2020 00:00:07 +0000 (18:00 -0600)] 
Use --tal argument with --init-tals (that now is a flag)

4 years agoForce to stop application on ENOMEM error
dhfelix [Sat, 28 Nov 2020 01:03:21 +0000 (19:03 -0600)] 
Force to stop application on ENOMEM error

discussed in #40

4 years agoAdd warning messages to notify start/end of first validation cycle
pcarana [Thu, 26 Nov 2020 00:19:57 +0000 (18:19 -0600)] 
Add warning messages to notify start/end of first validation cycle

4 years agoAdd docs for thread-pool.* args, add flow to reject RTR clients
pcarana [Wed, 25 Nov 2020 23:28:40 +0000 (17:28 -0600)] 
Add docs for thread-pool.* args, add flow to reject RTR clients

+An RTR client is rejected when there aren't available threads at the pool to attend it.
+Add new function at thread_pool.c to check if the pool has available threads to work.
+Use an internal buffer at sockaddr2str(), since the buffer received as parameter wasn't utilized by anybody.
+Update max values: thread-pool.server.max=500, thread-pool.validation.max=100.

4 years agoFix server.address examples
pcarana [Wed, 25 Nov 2020 22:08:04 +0000 (16:08 -0600)] 
Fix server.address examples

4 years agoRemove debug comments and code
pcarana [Tue, 24 Nov 2020 00:32:21 +0000 (18:32 -0600)] 
Remove debug comments and code

4 years agoUpdate to newer version 1.5.0 and TODO list at docs
pcarana [Tue, 24 Nov 2020 00:25:09 +0000 (18:25 -0600)] 
Update to newer version 1.5.0 and TODO list at docs

4 years agoUse thread pool for RTR server/clients, validation cycles at main thread
pcarana [Tue, 24 Nov 2020 00:20:40 +0000 (18:20 -0600)] 
Use thread pool for RTR server/clients, validation cycles at main thread

+Change the previous logic: RTR server lived at the main thread and the validation cycles were run in a distinct thread. Now the validation cycles are run at the main thread, and RTR server is spawned at a new thread.
+Create internal thread pool to handle RTR server task and delete RRDP dirs tasks.
+Create thread pool to handle incoming RTR clients. One thread is utilized per client.
+Create args: 'thread-pool.server.max' (spawned threads to attend RTR clients) and 'thread-pool.validation.max' (spawned threads to run validation cycles).
+Shutdown all living client sockets when the application ends its execution.
+Rename 'updates_daemon.*' to 'validation_run.*'.

4 years agoImplement a thread pool, still pending to use at RTR clients
pcarana [Fri, 6 Nov 2020 01:49:43 +0000 (19:49 -0600)] 
Implement a thread pool, still pending to use at RTR clients

+The pool is basically a tasks queue, it's initialized using a fixed amount of threads (all of them spawned at pool creation) where each of them will be waiting for pending tasks to attend.
+TODO: the number of threads per pool must be configurable.
+TODO: right now only a pool is utilized at the TALs validation (and therefore the whole RPKI tree beneath them), at least another pool can be used to receive RTR clients.

4 years agoAdd '--daemon' argument to daemonize fort, fixes #25
pcarana [Fri, 30 Oct 2020 20:18:13 +0000 (14:18 -0600)] 
Add '--daemon' argument to daemonize fort, fixes #25

+When the flag is enabled, any value set at '--log.output' and '--validation-log.output' is overwritten with 'syslog' (all enabled logs will be sent to syslog).
+Update the docs to include the new argument.

4 years agoAdd argument '--init-tals' to fetch RIR TALs
pcarana [Wed, 28 Oct 2020 00:22:11 +0000 (18:22 -0600)] 
Add argument '--init-tals' to fetch RIR TALs

+Once utilized, FORT tries to download the TALs and exits. In order to download ARIN TAL, the user must explicitly accept its RPA by typing yes (ignoring case) at stdin.
+Remove the write callback from HTTP download callers, it was unnecessary since every caller did the same thing.
+Update the docs to include the new argument.

4 years agoMerge from master (v1.4.2)
pcarana [Mon, 26 Oct 2020 23:55:13 +0000 (17:55 -0600)] 
Merge from master (v1.4.2)

4 years agoFix broken unit tests v1.4.2
pcarana [Tue, 20 Oct 2020 23:34:14 +0000 (18:34 -0500)] 
Fix broken unit tests

4 years agoMerge from 1.4.2 bug fix
pcarana [Mon, 19 Oct 2020 23:07:11 +0000 (18:07 -0500)] 
Merge from 1.4.2 bug fix

4 years agoExclude ARIN's TAL from git clean
pcarana [Mon, 19 Oct 2020 21:50:30 +0000 (16:50 -0500)] 
Exclude ARIN's TAL from git clean

4 years agoFix bug: data can be stale when the local-repository is deleted.
pcarana [Sat, 17 Oct 2020 01:27:26 +0000 (20:27 -0500)] 
Fix bug: data can be stale when the local-repository is deleted.

The data remained the same until an RRDP server had a delta update; in such case the updated files weren't found and the snapshot was processed, so the local cache was built again. In case that the RRDP server didn't had updates, the root manifest wasn't found and the whole validation cycle results were discarded.

Now, when the manifest isn't found and the RRDP has no updates, force the snapshot processing to assure that the error isn't of the RP. Also, update the daemon that cleans up the RRDP visited URIs, so that it deletes the files from its corresponding workspace.

4 years agoAdd links to Mikrotik, Arista, Nokia, and Huawei docs
pcarana [Thu, 1 Oct 2020 18:40:36 +0000 (13:40 -0500)] 
Add links to Mikrotik, Arista, Nokia, and Huawei docs

4 years agoMinor fixes: add a couple of spaces, and 'pr_crit' at thread errors
pcarana [Thu, 1 Oct 2020 17:31:17 +0000 (12:31 -0500)] 
Minor fixes: add a couple of spaces, and 'pr_crit' at thread errors

4 years agoUpdate to current version 1.4.2
pcarana [Tue, 29 Sep 2020 16:23:55 +0000 (11:23 -0500)] 
Update to current version 1.4.2

4 years agoAvoid the same leak that existed at v1.4.0
pcarana [Tue, 29 Sep 2020 15:21:26 +0000 (10:21 -0500)] 
Avoid the same leak that existed at v1.4.0

4 years agoMerge from master (v1.4.1)
pcarana [Tue, 29 Sep 2020 15:19:00 +0000 (10:19 -0500)] 
Merge from master (v1.4.1)

4 years agoUpdate current version to 1.4.1 v1.4.1
pcarana [Wed, 23 Sep 2020 18:08:47 +0000 (13:08 -0500)] 
Update current version to 1.4.1

4 years agoFix leaks due to bad struct release and wrong lock usage
pcarana [Wed, 23 Sep 2020 17:02:45 +0000 (12:02 -0500)] 
Fix leaks due to bad struct release and wrong lock usage

+Also add missing parenthesis at logging docs, and fix lock usage at RRDP DB (db_rrdp_reset_visited_tals).

4 years agoInclude RPM installation steps
pcarana [Wed, 9 Sep 2020 22:02:51 +0000 (17:02 -0500)] 
Include RPM installation steps

4 years agoRename LICENSE file, update year (a bit late), include license at dist
pcarana [Fri, 4 Sep 2020 23:28:39 +0000 (18:28 -0500)] 
Rename LICENSE file, update year (a bit late), include license at dist

4 years agoUpdate to newer version 1.4.1
pcarana [Wed, 2 Sep 2020 21:41:01 +0000 (16:41 -0500)] 
Update to newer version 1.4.1

4 years agoMerge from master
pcarana [Wed, 2 Sep 2020 15:43:04 +0000 (10:43 -0500)] 
Merge from master

4 years agoUpdate docs to include 'docker pull' option, related to #17
pcarana [Tue, 1 Sep 2020 21:38:52 +0000 (16:38 -0500)] 
Update docs to include 'docker pull' option, related to #17

4 years agoUse a local workspace fort RRDP related files, fixes #39.
pcarana [Tue, 1 Sep 2020 19:29:20 +0000 (14:29 -0500)] 
Use a local workspace fort RRDP related files, fixes #39.

+Whenever an RRDP file is identified (ie. update notification URI) create a directory at '--local-repository' where all of the RRDP files (XMLs as well as 'publish' elements at those snapshot/delta files) will be created and read.
+The rsync URIs at the publish/withdraw elements, are mapped to the location <--local-repository>/<rrdp workspace>/<URI part>. Eg. if '--local-repository=/tmp/fort' and the current workspace (each TAL has its own workspace) is 'ABC', then the URI 'rsync://example.com/foo/bar.cer' will be created at '/tmp/fort/ABC/example.com/foo/bar.cer'.
-RSYNC repositories are still created at '--local-repository'.

4 years agoRemove useless variable
pcarana [Fri, 28 Aug 2020 21:07:55 +0000 (16:07 -0500)] 
Remove useless variable

4 years agoUse the latest version (1.4.0) at Dockerfile
pcarana [Fri, 28 Aug 2020 20:54:45 +0000 (15:54 -0500)] 
Use the latest version (1.4.0) at Dockerfile

4 years agoClose socket on error, log bind info one time only v1.4.0
pcarana [Thu, 13 Aug 2020 21:42:25 +0000 (16:42 -0500)] 
Close socket on error, log bind info one time only

4 years agoAdd installation steps using Marco d'Itri (@rfc1036) debian package
pcarana [Fri, 7 Aug 2020 00:02:09 +0000 (19:02 -0500)] 
Add installation steps using Marco d'Itri (@rfc1036) debian package

4 years agoLog info message of revalidation only if 'incid-crl-stale' is 'warn'
pcarana [Thu, 6 Aug 2020 18:11:36 +0000 (13:11 -0500)] 
Log info message of revalidation only if 'incid-crl-stale' is 'warn'

4 years agoFix typos (prefered -> preferred)
pcarana [Tue, 4 Aug 2020 21:57:00 +0000 (16:57 -0500)] 
Fix typos (prefered -> preferred)

4 years agoMerge from master
pcarana [Tue, 4 Aug 2020 21:53:05 +0000 (16:53 -0500)] 
Merge from master